نظرة على الفن التوليدي الجديد

الفن التوليدي هو نوع من الفن ، مرئي في معظم الحالات ، يقوم على التعاون بين الإنسان والنظام المستقل. يُعرَّف "النظام المستقل" بأنه الذكاء الاصطناعي برنامج أو خوارزمية أو نموذج قادر على تنفيذ عمليات معقدة دون الحاجة إلى تدخل المبرمج.

من التجاور الغريبة للصور التي تم إنشاؤها بواسطة Dall-E ميني إلى NFT السوق ، الصور التي تم إنشاؤها بواسطة خوارزميات الذكاء الاصطناعي تدخل بشكل متزايد إلى الخيال السائد. في الواقع ، هناك مشروعان مهمان حول الموضوع الذي يستحق التحليل وهما: ميدجورني و DALL-E2.

بالطبع ، وصلت الأخبار أيضًا إلى Twitter. وعلق على ذلك ، من بين آخرين ، تشارلز هوسكينسون ، الذي كتب:

الفن التوليدي: التجارب والميزات المبكرة

بعد فهم ماهية الفن التوليدي ، من المهم التأكيد على أحد مبادئه التأسيسية: العشوائية. وهي خاصية أساسية للفن التوليدي.

في الواقع ، اعتمادًا على نوع البرنامج ، يكون النظام المستقل قادرًا على معالجة النتائج التي تكون دائمًا مختلفة وفريدة من نوعها في كل مرة يتم فيها تنفيذ أمر الإنشاء ، أو يمكنه إرجاع عدد متغير من النتائج استجابةً لإدخال المستخدم.

تعود التجارب الأولى في الفن التوليدي إلى الستينيات مع تجارب هارولد كوهين وله هارون برنامج. استخدم كوهين لأول مرة برنامجًا قائمًا بذاته لإنشاء أعمال فنية مجردة مستوحاة من Pop Art silkscreens. تُعرض أعمال كوهين الآن في معرض تيت في لندن.

سمة أخرى من سمات الفن التوليدي ، ولكنها أقل وأقل امتيازًا ، هي تكرار الأنماط أو العناصر المجردة التي يوفرها المبرمج ويتم تنفيذها داخل كود البرنامج.

بالإضافة إلى ذلك ، فإن تطوير شبكات عصبية متزايدة التعقيد تعمل على ارتباط صورة النص قد مكّن من تطوير نماذج توليدية قادرة على إنشاء صور واقعية ودقيقة بشكل متزايد. أفضل مثال معروف لهذه الفئة من الفن التوليدي هو دال- إي.

Dall-E هي شبكة عصبية متعددة الوسائط تعتمد على GPT-3 نموذج التعلم العميق من OpenAI، وهي نفس الشركة التي تم تطويرها مؤخرًا أيضًا شات جي بي تي، تم إطلاق chatbot في نوفمبر 2022 وتم تحسينه باستخدام "خاضع للإشراف" وتقنيات التعلم المعزز.

بالعودة إلى Dall-E ، نرى أن هذا النظام قادر على إنشاء صور من وصف نصي ، يسمى a "اِسْتَدْعَى،" استنادًا إلى مجموعة بيانات من أزواج النص والصورة.

يمثل الإصدار الأول من Dall-E ، الذي تم تقديمه للجمهور في يناير 2021 وظل من اختصاص عدد صغير من المهنيين في هذا المجال ، ثورة حقيقية من حيث هذا النوع من النموذج التوليدي ، متجاوزًا ابتكارات GPT- 3 نفسها.

ومن المهم أيضًا حقيقة أن دقة النتائج التي تمت معالجتها بواسطة Dall-E أثبتت أنها النطاق المثالي لحل OpenAI آخر: CLIP (التدريب المسبق على الصورة التقابلية).

شبكة عصبية لتصنيف الصور وترتيبها تم تدريبها على أساس ارتباطات الصور النصية ، مثل التسميات التوضيحية الموجودة على الإنترنت. بفضل تدخل CLIP ، الذي يقلل من عدد النتائج المقترحة للمستخدم لكل موجه إلى 32 ، تم العثور على Dall-E لإرجاع صور مرضية في معظم الحالات.

ميدجورني: التصميم والبنية التحتية البشرية والذكاء الاصطناعي

كما كان متوقعا، ميدجورني هو مشروع مهم يعد جزءًا من مفهوم Al Generative Art الناشئ. على وجه التحديد ، يعد Midjourney مختبرًا بحثيًا مستقلاً يستكشف طرقًا جديدة للتفكير ويوسع القدرات التخيلية للجنس البشري.

استخدامه بسيط: أولاً يجب إنشاء حساب على خلاف، وهي منصة تستضيف مجتمعات مختلفة ، حيث تعد Midjourney واحدة منها. يوجد داخل التطبيق غرف الدردشة المختلفة التي يمكن للمرء أن يشارك فيها بنشاط أو لا يشارك في المناقشات.

من المهم الإشارة إلى أنه لمحاولة استخدام الذكاء الاصطناعي لأول مرة ، يجب على المرء الذهاب إلى "مبتدئين" القنوات أين 25 تصيير مجاني متوفرة.

يتطابق عرض واحد مع توليد أربعة متغيرات مختلفة تم إنشاؤها من نفس المدخلات النصية.

وبالتالي ، تشير عمليات العرض الـ 25 إلى 25 مهمة معالجة يقوم بها الروبوت Midjourney. وبالتالي ، فإن إنشاء الصورة يتطلب التفاعل مع الروبوت Midjourney عبر رسالة نصية تسمى "موجه" ، حيث ستكون هناك كلمات رئيسية تصف الصورة التي يفكر فيها المستخدم.

يمكنك إضافة أي عدد تريده من التفاصيل ، المهم هو تقسيم الكلمات الرئيسية بفاصلة. بمجرد الانتهاء من العرض ، يقوم الكمبيوتر بإرجاع أربع صور مختلفة بناءً على الأوصاف للاختيار من بينها.

بالإضافة إلى ذلك ، بمجرد انتهاء البرنامج من العرض ، يمكنك توصيل تفضيلاتك بناءً على الصور ، وإذا كنت ترغب في ذلك ، يمكنك إنشاء أربعة إصدارات أخرى مرة أخرى.

DALL-E 2: نظام الذكاء الاصطناعي الجديد للأعمال الفنية

بالإضافة إلى Midjourney ، يعد DALL-E 2 أيضًا نظام AI الجديد الذي يمكنه إنشاء صور وأعمال فنية واقعية من وصف اللغة الطبيعية. ليس ذلك فحسب ، يمكن لـ DALL-E 2 أيضًا الجمع بين المفاهيم والسمات والأنماط.

تكمن قوة نظام الذكاء الاصطناعي الجديد أيضًا في القدرة على توسيع الصور بما يتجاوز ما هو موجود في اللوحة الأصلية التراكيب الموسعة الجديدة. بالإضافة إلى ذلك ، يمكنه إجراء تغييرات واقعية على الصور الموجودة من التسمية التوضيحية للغة الطبيعية ويمكنه إضافة عناصر وإزالتها مع مراعاة الظلال والانعكاسات والأنسجة.

تتضمن إمكانات DALL-E 2 أيضًا التقاط صورة وإنشاء العديد من الأشكال المختلفة المستوحاة من الأصل. لقد تعلم DALL-E 2 العلاقة بين الصور والنص المستخدم لوصفها.

يستخدم عملية تسمى "انتشار،" الذي يبدأ بنمط من النقاط العشوائية ويغير هذا النمط تدريجيًا باتجاه الصورة عندما يتعرف على جوانب معينة من تلك الصورة.

لذلك ، بعد أن قدمت شركة OpenAI DALL-E في يناير 2021 ، فإن أحدث نظام ، DALL-E 2 ، ينتج الآن صورًا أكثر واقعية ودقة بأربعة أضعاف الدقة.

بدأ DALL-E 2 كمشروع بحث وهو متاح الآن كملف النسخة التجريبية. تشمل وسائل التخفيف الأمنية التي طورها النظام ويستمر تحسينها ما يلي: الحد من قدرة النظام على إنتاج صور عنيفة أو كراهية أو صور للبالغين ، والنشر التدريجي القائم على التعلم.

المصدر: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/