مؤسس Midjourney ديفيد هولز حول تأثير الذكاء الاصطناعي على الفن والخيال والاقتصاد الإبداعي

ميدجورني أحد المحركات الرائدة للتكنولوجيا الناشئة لاستخدام الذكاء الاصطناعي (AI) لإنشاء صور مرئية من المطالبات النصية. أحدثت الشركة الناشئة التي تتخذ من سان فرانسيسكو مقراً لها أخباراً كمحرك للعمل الفني الذي فاز بجائزة في مسابقة عادلة بولاية كولورادو ، ومن غير المرجح أن تكون آخر مشكلة معقدة يواجهها فن الذكاء الاصطناعي في السنوات المقبلة.

يميز Midjourney عن الآخرين في الفضاء من خلال التأكيد على جماليات الرسم في الصور التي ينتجها. لا تحاول المنصة إنشاء صور واقعية يمكن الخلط بينها وبين الصور ، ويقول الرئيس التنفيذي ديفيد هولز إنه شخصيًا غير مرتاح جدًا للجودة الخارقة للتزييف العميق والأعمال الأخرى التي تحاكي الواقع عن كثب. بدلاً من ذلك ، يقول هولز إن Midjourney مصمم لإطلاق العنان لإبداع الأشخاص العاديين من خلال منحهم أدوات لعمل صور جميلة بمجرد وصفها.

ولكن على الرغم من التركيز الإنساني والموجه نحو المستهلك للشركة ، إلا أن هناك أسئلة حتمية حول الآثار المترتبة على الفن التجاري والفنانين المحترفين. لقد قابلت هولز من أجل أ قطعة أوسع حول الاضطرابات المحتملة التي من المحتمل أن يتسبب فيها فن الذكاء الاصطناعي في إنتاج الصور للترفيه وألعاب الفيديو والنشر. فيما يلي مقتطف أطول من محادثتنا حيث يوفر Holz مزيدًا من العمق والسياق أثناء تناوله لتلك القضايا وشرح رؤيته للشركة والصناعة والتكنولوجيا. تم تحرير المقابلة من أجل الطول والوضوح.

Rob Salkowitz، Forbes Contributor: ما هو دورك ولقبك؟

ديفيد هولز ، ميدجورني. أنا المؤسس والرئيس التنفيذي. عادةً ما أفضل أن يُدعى المؤسس ، لأن الرئيس التنفيذي يبدو عمليًا للغاية ، ولسنا رجال أعمال جدًا. نحن مختبر أبحاث تطبيقي يصنع المنتجات.

ما هي مهمة Midjourney؟

نحب أن نقول إننا نحاول توسيع القوى التخيلية للجنس البشري. الهدف هو جعل البشر أكثر إبداعًا ، وليس صنع آلات تخيلية ، وهو ما أعتقد أنه تمييز مهم.

هل يمكنك إعطاء نبذة مختصرة عن تاريخ الشركة حتى الآن؟

بدأنا العمل على الجزء التخيلي لشركتنا منذ حوالي عام ونصف. كانت هناك بعض الاختراقات في نماذج الانتشار ، فهم الناس القصاصات ، OpenAI ، هذا النوع من الأشياء. تقريبًا كل من شارك في هذا هو سان فرانسيسكو وأدركنا جميعًا أن الأمر سيصبح جادًا ، وأنه يختلف عن الكثير من الأشياء الأخرى.

ما الذي يراه Midjourney على أنه فائدة تقنية تحويل النص إلى صورة للأعمال والمجتمع؟

أنا بالتأكيد مهتم بالمجتمع أكثر من الأعمال. نحن منتج استهلاكي ، ولكن ربما 30٪ -50٪ من مستخدمينا الآن محترفون. الغالبية ليست كذلك. يخبرنا الفنانون على المنصة أنها تتيح لهم أن يكونوا أكثر إبداعًا واستكشافًا في البداية ، والتوصل إلى الكثير من الأفكار في فترة زمنية قصيرة.

في الوقت الحالي ، يستخدم مستخدمونا المحترفون النظام الأساسي للتصور. غالبًا ما يكون الجزء الأصعب من [مشروع فني تجاري] في البداية ، عندما لا يعرف صاحب المصلحة ما يريده ويتعين عليه رؤية بعض الأفكار للتفاعل معها. يمكن أن يساعد Midjourney الأشخاص في الالتقاء بالفكرة التي يريدونها بسرعة أكبر ، لأن التكرار على هذه المفاهيم أمر شاق للغاية.

ميزة أخرى للفنانين هي أنه يمنح الناس الثقة في المجالات التي لا يثقون بها. يشعر معظم الفنانين ، إن لم يكن جميعهم ، أن هناك جزءًا من الفن لا يمكنهم القيام به بشكل جيد. قد تكون الألوان والتكوين والخلفيات. لدينا مصمم شخصيات مشهور يستخدم منتجنا ويسأله الناس عن سبب استخدامك للذكاء الاصطناعي لأنك جيد جدًا بالفعل. وقال ، "حسنًا ، أنا فقط أجيد دور الشخصية. هذا يساعدني في الباقي ، والعالم ، والخلفية ، وأنظمة الألوان ".

حول كم عدد الأشخاص الذين يستخدمون المنتج؟

الملايين يستخدمونه. الخلاف لدينا أكثر من مليوني. إنه أكبر خادم Discord نشط حتى الآن.

هل يسمح ترخيص Midjourney بالاستخدام التجاري للصور التي تم إنشاؤها بواسطة النظام الأساسي؟

نعم. ولكن إذا كنت تعمل في شركة أكبر من مليون دولار من العائدات السنوية ، فنحن نطلب منك شراء ترخيص شركة.

كيف تم بناء مجموعة البيانات؟

إنها مجرد خدش كبير للإنترنت. نحن نستخدم مجموعات البيانات المفتوحة التي يتم نشرها والتدريب عليها. وأود أن أقول أن هذا شيء يفعله 100٪ من الناس. لم نكن صعب الإرضاء. يتطور العلم حقًا بسرعة من حيث كمية البيانات التي تحتاجها حقًا ، مقابل جودة النموذج. سيستغرق الأمر بضع سنوات لمعرفة الأشياء حقًا ، وبحلول ذلك الوقت ، قد يكون لديك نماذج تدربها بدون أي شيء تقريبًا. لا أحد يعرف حقًا ما يمكنهم فعله.

هل سعيت للحصول على موافقة من الفنانين الأحياء أو العمل لا يزال تحت حقوق النشر؟

لا ، ليس هناك طريقة حقيقية للحصول على مائة مليون صورة ومعرفة من أين أتوا. سيكون رائعًا إذا كانت الصور تحتوي على بيانات وصفية مضمنة فيها حول مالك حقوق الطبع والنشر أو شيء من هذا القبيل. لكن هذا ليس شيئًا. لا يوجد سجل. لا توجد طريقة للعثور على صورة على الإنترنت ، ثم تتبعها تلقائيًا إلى مالك ومن ثم يكون لديك أي طريقة لفعل أي شيء لمصادقتها.

هل يمكن للفنانين إلغاء الاشتراك في نموذج تدريب البيانات الخاص بك؟

نحن نبحث في ذلك. التحدي الآن هو معرفة القواعد ، وكيفية معرفة ما إذا كان الشخص هو الفنان حقًا لعمل معين أو مجرد وضع اسمه عليه. لم نواجه أي شخص يريد إزالة اسمه من مجموعة البيانات.

هل يمكن للفنانين إلغاء الاشتراك في المطالبات؟

ليس الآن. نحن نبحث في ذلك. مرة أخرى ، سيتعين علينا إيجاد طريقة لمصادقة هذه الطلبات ، والتي يمكن أن تصبح معقدة.

ماذا تقول للفنانين التجاريين القلقين من أن هذا سيدمر معيشتهم؟ في مرحلة معينة ، لماذا يقوم مدير فني بتوظيف رسام لإنتاج أعمال مثل فن المفهوم ، وتصميم الإنتاج ، والخلفيات - تلك الأنواع من الأشياء - بينما يمكنهم فقط إدخال المطالبات والحصول على مخرجات مفيدة بسرعة أكبر وبتكلفة أقل بكثير؟

لا يزال هناك الكثير من العمل. إنها ليست مجرد "اجعلني خلفية". قد يكون العمل أقل بعشر مرات ، لكنه عمل أكثر بكثير مما سيفعله المدير.

أعتقد أن هناك طريقتين يمكن أن يحدث هذا. إحدى الطرق هي محاولة توفير نفس المستوى من المحتوى الذي يستهلكه الأشخاص بسعر أقل ، أليس كذلك؟ والطريقة الأخرى للقيام بذلك هي بناء محتوى أفضل بكثير بالأسعار التي نرغب بالفعل في إنفاقها. أجد أن معظم الناس ، إذا كانوا ينفقون المال بالفعل ، ولديك الاختيار بين محتوى أفضل بشكل كبير أو محتوى أرخص ، في الواقع يختارون محتوى أفضل بشكل كبير. لقد حدد السوق بالفعل سعرًا يرغب الناس في دفعه.

أعتقد أن بعض الناس سيحاولون قطع الفنانين. سيحاولون صنع شيء مشابه بتكلفة أقل ، وأعتقد أنهم سيفشلون في السوق. أعتقد أن السوق سيتجه نحو جودة أعلى ومزيد من الإبداع ومحتوى أكثر تعقيدًا وتنوعًا وعمقًا. والأشخاص الذين هم في الواقع قادرون على استخدام مثل الفنانين واستخدام الأدوات للقيام بذلك هم الذين سيفوزون.

هذه التقنيات في الواقع تخلق تقديرًا أعمق ومعرفة القراءة والكتابة في الوسط المرئي. قد يكون لديك بالفعل طلب ، يتجاوز القدرة على الإنتاج في هذا المستوى ، وبعد ذلك ربما سترفع في الواقع رواتب الفنانين. قد يكون الأمر غريبًا ، لكن هذا ما سيحدث. ستؤدي وتيرة هذا الطلب المتزايد على كل من الجودة والتنوع إلى إنجاز بعض المشاريع الرائعة وغير المتوقعة.

تخرج جيل من الطلاب في مدارس الفنون ، وكثير منهم مدينون بشدة ، معتمدين على وظائف ذات رواتب جيدة نسبيًا في الإنتاج الترفيهي وإنتاج ألعاب الفيديو والفنون التجارية وما إلى ذلك. كيف يؤثر ظهور منصات AI لتحويل النص إلى صورة على مستقبلهم؟

أعتقد أن بعض الناس سيحاولون خفض التكاليف ، وسيحاول البعض توسيع الطموحات. أعتقد أن الأشخاص الذين يوسعون الطموحات سيظلون يدفعون نفس الرواتب ، والأشخاص الذين يحاولون خفض التكاليف ، أعتقد أنهم سيفشلون.

عادةً ما يتم استخدام الذكاء الاصطناعي على نطاق واسع لأشياء مثل مراكز الاتصال أو فحص الحقائب في المطارات ونوع الوظائف التي لا يهتم الناس حقًا بأدائها. وعرض القيمة هو أنه يحرر الناس للقيام بأنواع أكثر مكافأة وأكثر إثارة للاهتمام من الوظائف. لكن الوظائف الفنية مجزية ومثيرة للاهتمام. يعمل الناس طوال حياتهم ويطورون مهاراتهم للحصول على هذا النوع من الوظائف. لماذا تشير هذه التكنولوجيا إلى ذلك المستوى من الاقتصاد كنوع من التركيز على الأعمال التجارية والأولوية للأشياء التي تقوم بها؟

أنا شخصياً لست كذلك. أغراضي ليست مصنوعة للفنانين المحترفين. إذا كانوا يرغبون في استخدامه ، فهذا شيء رائع. صنعت أشيائي للأشخاص الذين ، مثل ، هناك هذه المرأة في هونغ كونغ ، وقد أتت إلي ، وقالت ، "الشيء الوحيد في هونغ كونغ أن والديك لا يريدانك أبدًا أن تكوني فنانة ، وأنا" م مصرفي الآن. أنا أعيش حياة مصرفيّة جيدة. ولكن مع Midjourney الآن بدأت في الواقع أتذوق هذه التجربة لكوني الشخص الذي أردت أن أكونه بالفعل ". أو توقف شاب في الشاحنة يقوم بصنع بطاقات البيسبول الخاصة به بصور جامحة ، من أجل المتعة فقط. إنه مصمم لهؤلاء الأشخاص ، لأنهم ، مثل معظم الناس ، لا يمكنهم فعل هذه الأشياء أبدًا.

من المهم التأكيد على أن الأمر لا يتعلق بالفن. هذا عن الخيال. يستخدم الخيال أحيانًا للفن ولكنه غالبًا لا يستخدم. لا يتم استخدام معظم الصور التي تم إنشاؤها على Midjourney بشكل احترافي. لا يتم حتى تقاسمها. يتم استخدامها فقط لهذه الأغراض الأخرى ، هذه الاحتياجات الإنسانية للغاية.

ومع ذلك ، فإن مخرجات منتجك هي الصور ، والتي لها قيمة تجارية في السياق المهني بالإضافة إلى كل تلك الخصائص الأخرى. وهذا أمر معطّل جدًا لهذا الاقتصاد.

أعتقد أننا نصنع قاربًا ، ويمكن لأي شخص أن يتسابق مع القارب ، لكن هذا لا يعني أن القارب يدور حول السباق. إذا كنت تستخدم القارب للسباق ، فربما يعجبك ذلك بالتأكيد. في تلك اللحظة هو. لكن الجانب الإنساني مهم حقًا ، وأعتقد أننا لسنا ... نريد أن نجعل الصور تبدو جميلة. نحن لا نرى أنفسنا نحاول خلق الفن كجزء من شئنا. نريد أن يكون العالم أكثر إبداعًا. نفضل أن نصنع الأشياء الجميلة على الأشياء القبيحة.

هل تعتقد أن أي هيئة حكومية لديها اختصاص أو سلطة لتنظيم هذه التكنولوجيا؟ وإذا كان الأمر كذلك ، فهل تعتقد أنه ينبغي عليهم ذلك؟

لا أعلم. التنظيم مثير للاهتمام. عليك أن توازن بين حرية القيام بشيء ما وبين حرية الحماية. التكنولوجيا نفسها ليست هي المشكلة. إنه مثل الماء. يمكن أن تكون المياه خطرة ، ويمكن أن تغرق فيها. لكنها ضرورية أيضًا. لا نريد حظر الماء فقط لتجنب الأجزاء الخطرة.

حسنًا ، نريد التأكد من أن مياهنا نظيفة.

نعم هذا صحيح.

المصدر: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- الاقتصاد الإبداعي /