أصاب أندي كوسوفسكي الأرق في ليلة من هذا الصيف، فقرر أن يجرب أداة إنشاء المقاطع المصورة (Veo 3) التي أصدرتها ”جوجل“ حديثاً. ربما يكون ما جاء به مساهمة في تدشين عصر جديد لوسائل التواصل الاجتماعي، وربما لقطاع الترفيه عن بكرة أبيه.
أراد الشاب العشريني الذي يعمل في مجال التسويق من نيويورك، اختبار مهاراته مع إشباع فضوله حول أدوات الذكاء الاصطناعي الجديدة التي تُحوّل تعليمات من بضع عبارات إلى مقاطع مصورة قصيرة واقعية.
في معرض تأمله للجاذبية الخالدة للحيوانات اللطيفة ذات الفراء، بالإضافة إلى انجذاب جيله الشديد للمشاهد العفوية التي تلتقطها الكاميرات، أدخل أوامر مثل: إنشاء مقطع مصور التقطته كاميرا أمنية ليلية بدقة ضعيفة لمجموعة أرانب برية تتقافز على ترمبولين في فناء خلفي مُشجر. ولإثارة النقاش وإبراز قوة الذكاء الاصطناعي، أضاف: “الأرانب تقفز ويختفي أحدها”.
الذكاء الاصطناعي ينافس الفنانين في سوق الأغاني
نشر مقطع الفيديو، الذي تبلغ مدته 8 ثوانٍ، عبر ”تيك توك“ في وقت متأخر من 26 يوليو تحت اسم “rachelthecatlovers”. وجاء في التعليق: “تحققت للتو من كاميرا مراقبة المنزل… وأعتقد أن مؤدين زاروا فناءنا الخلفي”.
تولت الإنترنت ما تبقى، فعلى مدى الأسابيع القليلة التالية، حصد الفيديو 237 مليون مشاهدة (أي نحو ضعف عدد مشاهدي مباراة السوبر بول المباشرة). وتوجه آلاف المحققين من خلف الكواليس إلى قسم التعليقات لمناقشة أصالته والتفسير الفيزيائي غير المعقول لكيفية تحول ستة أرانب فجأة إلى خمسة.
تابع كوسوفسكي كل ذلك بشعور بأن ثمة تغييراً هائلاً قادم في هوليوود. قال: “هذه مجرد نقطة بداية. أفكر في هذا الأمر كالثورة الصناعية. إنه إضفاء الطابع الديمقراطي على الإبداع”.
هل هذا من هراء الذكاء الاصطناعي؟
أرانب تقفز وغوريلا تتحدث ومقابلات مع رُضّع، إن أمضيت بعض الوقت تقلّب بين المقاطع على ”إنستغرام“ أو ”تيك توك“ أو ”إكس“ أو ”يوتيوب“ في الآونة الأخيرة، لربما لاحظت انتشار المقاطع المُولّدة بالذكاء الاصطناعي.
يصفه النقاد بأنه “هراء الذكاء الاصطناعي”، وأنه يفتقد الخيال ويتميز بتجسيد الحيوانات والنكات السخيفة. لكن هذا يتجاهل الأساسيات: تبدو مقاطع الفيديو جيدة جداً، وتميل إلى الحصول على كثير من المشاهدات والمشاركات، ولا تكلف المبدعين شيئاً يُذكر لإنتاجها.
الذكاء الاصطناعي يستحضر نجوماً ويجلب لورثتهم عوائد مجزية
يقول هاني فريد، أستاذ الهندسة الكهربائية وعلوم الحاسوب في جامعة كاليفورنيا في بيركلي ومؤسس شركة ”غيت ريل سيكيوريتي“ (GetReal Security) للكشف عن التزييف العميق: “لا يمكنك إنكار مدى روعة هذه التقنية وتمكينها… تخيل ما يمكن للمراهق العادي الوصول إليه الآن. لست بحاجة إلى ميزانيات بملايين الدولارات أو مواقع تصوير أو ممثلين. كل ما تحتاجه هو خيالك”.
حدث كل هذا فجأة، إذ سهّلت التطورات في خوارزميات التعلم الآلي وقدرة المعالجة ونماذج اللغة الكبيرة من ”جوجل“ و”أوبن إيه آي” وشركات أخرى، تحويل الأفكار الملهمة إلى مقاطع فيديو وتسريع انتشارها. لقد أصدرت ”جوجل“ (Veo 3) في مايو.
اختصار تكاليف مليونية بحفنة دولارات
تبلغ تكلفة إنشاء فيديو مدته 8 ثوانٍ 6 دولارات، ويمكن الآن إنشاء مؤثرات صوتية وتحويل النص إلى حوار منطوق، مع حركة شفاه الشخصيات بشكل واقعي أثناء حديثها. التحسينات صارخة: في عام 2023، كان مقطعاً مصوراً معدّ باستخدام الذكاء الاصطناعي للممثل ويل سميث وهو يأكل السباغيتي – لسبب ما، وهو معيار مهم لتقدم الذكاء الاصطناعي – مليئاً بالأخطاء وغير واقعي. يبدو مقطع فيديو مشابه هذا العام جيداً لدرجة أنه سيجعلك تشعر بالجوع.
يستفيد المبدعون من هذه التحسينات. جوناثان بونسكي هو الأكبر بين أربعة إخوة في مونتريال، ويديرون شركة شبكات اجتماعية لأصحاب الحيوانات الأليفة تسمى ”دوغ باك“ (DogPack). بإلهام من طفرة غير مفهومة لمقاطع اجتماعية معدّة بواسطة الذكاء الاصطناعي يظهر فيها حيوان يتي الخرافي متحدثاً، بدأوا بنشر مقاطع فيديو لكلاب في استوديو بودكاست يتبادلون النكات عن أصحابهم ويتضاحكون.
لا تثق بكل ما تراه.. كيف يزيف الذكاء الاصطناعي صور وفيديوهات الحروب والصراعات؟
الفكاهة هي نكات من قبيل ما يأتي به الآباء ليضحكوا أطفالهم، مثلاً تجد كلباً من فصيلة لابرادور يقول: “يسألوننا دائماً أسئلة بديهية، مثل: هل تريد مكافأة؟ هل يعتقدون أنني أقعي جالساً لأنني استمتع بذلك؟” لكن لدى الأخوين الآن بضع مئات الآلاف من المتابعين على ”تيك توك“ و“إنستغرام“، ويتلقون طلبات من مالكي كلاب مشهورة على الإنترنت، مثل والتر جيفري البولدوغ الفرنسي، لإضافة صور حيواناتهم الأليفة إلى ما يسمى بـ “بادكاست”.
قال بونسكي: ”سئم الناس من مشاهدة السيارات الفارهة والساعات الفاخرة وأناس يتفاخرون على وسائل التواصل الاجتماعي بما يجنونه من أموال… إنهم يريدون الترفيه. والآن يمكنك جعل الكلاب تتحدث“. أضاف أن المقاطع المصورة وسيلة غير مكلفة لجذب مستخدمين جدد إلى (DogPack).
يبدو أن كثيراً من هذه المقاطع مصممة لجذب المشاهد والانتشار على نطاق واسع، مثل إعادة تمثيل مدينة بومبي قبل ثوران البركان بواسطة الذكاء الاصطناعي، وهي إعادة تمثيل مثيرة للشكوك تاريخياً، أو تخيل للرومان القدماء يستكشفون النجوم على متن سفن فضائية.
كثير منها سخيف ومكرر مثل مقاطع لأشخاص يقفزون على أسرّة مصنوعة من الجبن أو الشوكولا، أو مقاطع لكواكب وهي تُنشر على هيئة المربى على خبز التوست.
الهدف الأساسي هو الكسب المادي
يعترف بعض المبدعين بأن مقاطعهم المصورة تهدف إلى إغراء خوارزميات وسائل التواصل الاجتماعي وكسب المال من ”إنستغرام“ و“يوتيوب“ و“تيك توك“، التي تدفع مقابل المقاطع المصورة الأصلية التي تجذب انتباه المستخدمين لأكثر من بضع ثوانٍ. قال علي سلطان، 27 عاماً، من لاهور، باكستان، الذي أطلق عنان مقاطع الأسرّة المصنوعة من الطعام عبر “تيك توك”: “إنه طعم يستجرّ النقرات”.
يقتنص منشئو الذكاء الاصطناعي الآخرون الملكية الفكرية الثمينة لهوليوود. بدأ كابير راجديف، البالغ من العمر 13 عاماً من نيويورك، باللعب بالذكاء الاصطناعي في وقت فراغه هذا الصيف، مستخدماً (Veo 3) لإنشاء مقاطع فيديو من بطولة جنود العاصفة من فيلم ”حرب النجوم“، الذين يُنادون بعضهم البعض”يا أخي” ويروون مغامراتهم.
قال كابير، الذي أنتج بضع عشرات من المقاطع المصورة، إنه يستخدم “تشات جي بي تي” لكتابة النصوص واقتراح الوسوم، ثم يطلب من (Veo 3) إنشاء المقاطع؛ ويُحررها إلى مقاطع فيديو أطول ويختار أفضلها لتحميله. حصدت جميع مقاطع الفيديو آلاف المشاهدات وتعليقات حماسية من قبيل: “أفضل بكثير من (ديزني)”. قال والده روهيت إن ابنه حصل على ثلاث رعايات وربح حوالي 1500 دولار. لم يتلقوا أي رسائل عدائية من شركة “لوكاس فيلم” التابعة لشركة “والت ديزني”، التي لم ترد على طلب التعليق.
سكارليت جوهانسون تعين محامين لحذف صوت روبوت “أوبن إيه آي” المشابه لصوتها
في الماضي، كانت هوليوود تُسيطر على صناعة الترفيه السائدة. ويريد ديفيد إليسون، سليل وادي السيليكون، مواصلة هذا التقليد وقد دمج حديثاً شركته ”سكاي دانس ميديا“ مع ”باراماونت غلوبال“ في صفقة هزّت القطاع قدرها 8 مليارات دولار.
لقد بدأ مشاهير ”يوتيوب“ مثل جيمي دونالدسون، المعروف أيضاً باسم ”مستر بيست“، ومُنشئة محتوى الأطفال ”ميس ريتشل“، في تخفيف قبضة الاستوديوهات على انتباهنا.
مع ذلك، يتبنى بعض صانعي الأفلام الأذكياء الذكاء الاصطناعي؛ إذ تقول إحدى الشركات المدعومة من ”أمازون“، إنها تخطط لاستخدامه لإعادة بناء اللقطات المفقودة من فيلم (Magnificent Ambersons) التي فُقدت عندما تولى الاستوديو مسؤولية التحرير من الفنان أورسون ويلز.
مراقبة تطورات إنتاج المقاطع عبر الذكاء الاصطناعي
كما يقع على عاتق شركات التواصل الاجتماعي واجب مراقبة هذا المشهد الجديد. على الرغم من أن كثير من مقاطع الذكاء الاصطناعي تُعتبر مُتعةً غير ضارة، إلا أن التزييف العميق يهدف إلى خداع المستخدمين – مثل مقطع الفيديو الذي نُشر في ربيع العام الماضي للرئيس الأوكراني فولوديمير زيلينسكي وهو يُصدر أوامره لقواته بالاستسلام.
يسهل تخيّل موجة من مقاطع فيديو الذكاء الاصطناعي المُتلاعبة التي تهدف إلى التأثير على الانتخابات، وتزوير أسواق المراهنات الرياضية، وإحداث فوضى عارمة وإرباك في المجتمع.
يطلب ”إنستغرام“ و“تيك توك“ ومواقع أخرى حالياً من مُنشئي المحتوى النقر طواعيةً على مربع يُصنّف مقاطع الفيديو الخاصة بهم على أنها مُولّدة بواسطة الذكاء الاصطناعي. قال كوسوفسكي، مُبتكر أرانب الترمبولين، إنه لم يُلاحظ هذا الخيار في البداية ولم يعمد لاستخدامه إلا لاحقاً.
“OpenAI” تبني أداة لكشف الصور المولدة بالذكاء الاصطناعي
قالت ساهانا أودوبا، أستاذة أنثروبولوجيا الإعلام في جامعة لويولا ماريماونت في ميونيخ، إن المواقع تتحمل “حداً أدنى من المسؤولية” لتحديد مقاطع فيديو الذكاء الاصطناعي ووسمها تلقائياً، بالإضافة إلى التحقيق في المستخدمين الذين يُنشئون التزييف العميق ومنعهم من استخدامها.
قالت: “قد تحمل مقاطع الفيديو المُولّدة بالذكاء الاصطناعي أكاذيب سافرة وعبارات لاذعة مليئة بالكراهية، كما كانت تفعل الخطابات الإلكترونية القائمة على النصوص والصور حتى قبل أن تصبح مُولّدات الصور بالذكاء الاصطناعي رائجة”.
لم تُبدِ شركات التقنية وجهات تنظيمها في الولايات المتحدة اهتماماً يُذكر بتصنيف المحتوى أو تعديله حديثاً. ما يُعجبهم حقاً هو التفاعل الكبير من المستخدمين وإيرادات الإعلانات التي تجنيها. لذا ربما علينا أن نحبس أنفاسنا ونأمل بأن يأتي الأفضل، ونحاول الاستمتاع بتلك الأرانب المتقافزة.