مستقبل فن الذكاء الاصطناعي … أمر مرعب

في الأسبوع الماضي فقط ، أطلقت شركة بريطانية تدعى Stability AI نموذج ذكاء اصطناعي تم تغذيته بشكل غني ، مثل السلوقي الخالي من شرائح اللحم ، على عدة مليارات من الصور ، لتجهيزه لعمل صور جديدة تمامًا عند المطالبة برسالة لغوية.

يطلق عليه Stable Diffusion وهو ثوري من نواحٍ متعددة ، ولعل أهمها هو: على عكس النماذج الأخرى ، يسمح “ المالكون ” لأي شخص باستخدام Stable Diffusion من البداية (مع قيود جوهرية على الصور الجنسية أو المتحيزة وما إلى ذلك) على). يمكنك تجربتها ببطء ومجانًا هنا ، أو يمكنك تسريع الأمور والدفع مقابل مبلغ من المال للصورة بإصدار سهل الاستخدام للغاية هنا.

هل هي جيدة؟

للإجابة على هذا ، فإن أفضل طريقة هي أن تظهر لك ما يمكنها فعله: ما تمكنت من إنتاجه في بضع ساعات من التجربة.

في وقت مبكر ، أدركت أن Stable Diffusion الانتشار المستقر ليس بهذه الروعة – على الأقل في يدي غير الخبيرة – في إنتاج مجموعة صور مثالية حسب الطلب. على سبيل المثال ، حاولت إنتاج محاكاة لتوضيح لصاحب الغارديان لباندا جالس على أريكة طبيب نفسي. أفضل ما حصلت عليه بعد نصف ساعة كان ثعلبًا متأملًا يحدق في رجل عجوز ملتح. من لديه ثلاث أرجل. ليس عظيما. ومع ذلك ، استطعت أيضًا الشعور بالإمكانيات: التحديق في لوحة القيادة في Stable Diffusion ، شعرت أنني كنت جالسًا في قمرة القيادة لطائرة نفاثة مبكرة ولسبب سخيف كنت أجبرها على اصطحابي للتسوق.

في هذه المرحلة ، قررت أن أترك Stable Diffusion الانتشار المستقر بعيدًا عن المقود. تعامل معه باعتباره موهوبًا رائعًا ، وخياليًا للغاية ، وربما تلفًا في الدماغ ومتعاونًا مخمورًا بلا ريب. عبقري ضال عرضة للملل ويتطلب القليل من التنبيهات والتلميحات. ضمن هذه الديناميكية ، أود أن أترك Stable Diffusion يرشدني إلى حيث تريد أن أذهب.

بدلاً من التعليمات الصارمة ، أعطيته هدفًا ذهنيًا: جعل شيئًا مخيفًا. شيء صادم حقًا. أنا كاتب أفلام إثارة بعد كل شيء ، وأنا أحب أفلام الرعب. قررت أيضًا التركيز على إنشاء الصور ، لأن لديهم زحفًا طبيعيًا بالنسبة لي. وبالتالي ، قررت إنشاء بعض “الصور القديمة” الجديدة والغريبة. وعلى الفور ، بدأت في الحصول على نتائج أفضل. الصورة في أعلى الصفحة واحدة منها. وفيما يلي بعض أكثر.


لقد أمضيت ساعات سعيدة في القيام بذلك ، وكنت سعيدًا جدًا بالصور التي تم إنتاجها. إنها – بالنسبة لي – مقلقة وغريبة وغريبة. وهو بالتأكيد ما كنت أهدف إليه. ومع ذلك ، فهي ليست مخيفة حقًا.

بحلول هذا الوقت ، أدركت أن الكلمات التي تستخدمها في مطالبتك مهمة للغاية. من الأهمية بمكان أن كلمة جديدة – موجه – تم صياغتها لوصف المهارة. حشدت أفضل ما لدي من الكلمات الاستفزازية ، ثم نزلت في النهاية على “ألبينو” – ووضعتها في مطالباتي. هناك شيء ما في هذه الكلمة – ارتباطاتها المحزنة بالخوف والوحدة والمرض – دفعت الآلة إلى زيادة السرعة. الآن كان ينتج صورًا رهيبة بشكل صحيح:


كانت هناك العشرات من “الصور” مثل هذا: غريب للغاية ، مخيف بقوة. ثم وصلت إلى ذروتي بصورة معينة ، مما يجعلني أفشل حتى الآن. ها هو:
اسف بشأن ذلك. لكن عليك أن تراها لتستشعر قوة Stable Diffusion الانتشار المستقر. هذه ليست سيارة صغيرة تأخذها إلى المتاجر ، إنها طائرة نفاثة قادرة على التحليق في الستراتوسفير. وتذكر أن الآلة تخفق هذه الصور من بياض البيض للتاريخ الفني في ثوانٍ. على الرغم من أنها احتاجت إلي – أو شخصًا ودودًا آخر – لصقل المطالبات.

ماذا يعني هذا بالنسبة للفنون المرئية في المستقبل؟

أعتقد أن هذا يعني أن كل شيء يتغير. نحن فقط في بداية ثورة الذكاء الاصطناعي الفنية ، لكن هذا يبدو وكأنه فريد. لحظة يتحول فيها الإبداع. وهذا ينطبق على الفنون البصرية المتحركة بقدر ما ينطبق على الرسومات والصور واللوحات. يعد شباب The Stable Diffusion بإصدارات حركية من النموذج الفني قريبًا جدًا ، كاملة مع الصوت ، 3D ، الرسوم المتحركة ، سمها ما شئت. إنها ، بالنسبة للفنانين في كل مكان ، لحظة مخيفة بقدر ما هي مثيرة. على الرغم من أنه ليس مخيفًا مثل صراخ طفل ألبينو في تلك الصورة.


Sean Thomas

The Spectator 


يقول محدّثي :
لمّا تخرج الكلمة للعلن …فلا سلطة لك عليها …
كل يرميها بسهم عينه ..

 

ماهر حمصي

إبداع بلا رتوش
إشترك في القائمة البريدية