قام Oriol Nieto من شركة Adobe بتحميل مقطع فيديو قصير يحتوي على مجموعة من المشاهد والتعليق الصوتي، ولكن بدون مؤثرات صوتية. قام نموذج الذكاء الاصطناعي بتحليل الفيديو وتقسيمه إلى مشاهد، مع وضع علامات عاطفية ووصف لكل مشهد. ثم جاءت المؤثرات الصوتية. يلتقط نموذج الذكاء الاصطناعي مشهدًا باستخدام منبه، على سبيل المثال، وينشئ تأثيرًا صوتيًا تلقائيًا. حددت مشهدًا حيث كانت الشخصية الرئيسية (الأخطبوط، في هذه الحالة) تقود السيارة، وأضافت مؤثرًا صوتيًا لإغلاق الباب.

لم تكن مثالية. لم يكن صوت المنبه واقعيًا، وفي مشهد كانت فيه شخصيتان تتعانقان، أضاف نموذج الذكاء الاصطناعي حفيفًا غير طبيعي للملابس لم ينجح. بدلاً من التحرير يدويًا، استخدمت Adobe واجهة محادثة (مثل ChatGPT) لوصف التغييرات. في مشهد السيارة، لم يكن هناك صوت محيط من السيارة. بدلاً من تحديد المشهد يدويًا، استخدمت Adobe واجهة المحادثة وطلبت من نموذج الذكاء الاصطناعي إضافة تأثير صوت السيارة إلى المشهد. لقد نجح في العثور على المشهد، وإنشاء التأثير الصوتي، ووضعه بشكل مثالي.

هذه الميزات التجريبية غير متوفرة، لكنها عادةً ما تجد طريقها إلى مجموعة Adobe. على سبيل المثال، تم عرض ميزة Harmonize، وهي ميزة في Photoshop تقوم تلقائيًا بوضع الأصول ذات الألوان والإضاءة الدقيقة في المشهد، في Sneaks العام الماضي. والآن هو في برنامج فوتوشوب. ومن المتوقع أن تظهر في وقت ما في عام 2026.

يأتي إعلان Adobe بعد أشهر فقط من إنهاء الممثلين الصوتيين لألعاب الفيديو إضرابًا دام عامًا تقريبًا لتأمين الحماية حول الذكاء الاصطناعي، حيث يُطلب من الشركات الحصول على الموافقة وتقديم اتفاقيات الكشف عندما يرغب مطورو الألعاب في إعادة إنشاء صوت الممثل الصوتي أو شبهه من خلال الذكاء الاصطناعي. كان الممثلون الصوتيون يستعدون للتأثير الذي سيحدثه الذكاء الاصطناعي على الأعمال منذ بعض الوقت، وتعد ميزات Adobe الجديدة، حتى لو لم تولد تعليقًا صوتيًا من الصفر، علامة أخرى على التحول الذي يفرضه الذكاء الاصطناعي على الصناعة الإبداعية.

شاركها.