أجرت صحيفة واشنطن بوست اختبارًا شاملاً لتقييم كفاءة نماذج الذكاء الاصطناعي في توليد الصور والاستجابة لطلبات المستخدمين، مع التركيز على الأدوات المتاحة للجمهور. وقد كشف الاختبار عن اختلافات كبيرة في الأداء بين النماذج المختلفة، مع بروز نموذج “جيميناي” كالأكثر فعالية في توليد الصور، مما يثير تساؤلات حول مستقبل هذه التكنولوجيا وتأثيرها على صناعة التصوير.
وشملت الدراسة خمسة نماذج رئيسية، وهي Adobe Firefly، وBytedance Seedream Image 4.0، وGemini 3 Pro، وChatGPT-5، وMeta AI، في نسخها الاحترافية والمدفوعة لضمان أعلى معايير الجودة. ركزت الاختبارات على قدرة النماذج على تعديل الصور، وإضافة عناصر جديدة، وإزالة الأشخاص، وتوليد صور دقيقة لليدين والوجوه، وهي تحديات معروفة في مجال الذكاء الاصطناعي التوليدي.
منهجية اختبار نماذج الذكاء الاصطناعي لتوليد الصور
اعتمدت صحيفة واشنطن بوست على منهجية اختبارية دقيقة لضمان موضوعية النتائج. لم يقتصر التقييم على آراء المحررين التقنيين، بل تم الاستعانة بلجنة تحكيم مستقلة تضم خبراء متخصصين في التصوير والفنون الرقمية. تهدف هذه المنهجية إلى تقديم تقييم واقعي لأداء النماذج في الاستخدام اليومي.
تألفت لجنة التحكيم من ثلاثة أعضاء بارزين: ديفيد كارسون، المصور الصحفي الحائز على جائزة بوليتزر؛ وداليا دريسر، الفنانة التشكيلية الرقمية؛ وبراتيك نايك، خبير تنقيح الصور. وقد قاموا بتقييم الصور المولدة بناءً على معايير الجودة والدقة والواقعية، بالإضافة إلى مدى إبداع النموذج وقدرته على تلبية متطلبات المستخدم.
تفاصيل الاختبارات الخمسة
تضمن الاختبار خمسة سيناريوهات مختلفة لتقييم قدرات النماذج في توليد الصور. أولاً، تم اختبار قدرة النماذج على تعديل الوجوه، وتحديداً إضافة شعر إلى صورة الممثل دواين جونسون. ثانياً، طُلب من النماذج توليد صورة فنية لغزال بألوان مبهرة. ثالثاً، تم اختبار قدرة النماذج على إزالة شخص من صورة تجمع بين كريستيان ستيورات وروبرت باتينسون.
أما الاختبار الرابع، فقد ركز على توليد صورة لممثل يبكي فرحاً لفوزه بجائزة الأوسكار، مع التركيز على إظهار المشاعر بشكل واقعي. وأخيراً، تم اختبار قدرة النماذج على توليد صورة لأيدٍ تمسك برأس شخص من الخلف، مع التأكد من أن الأصابع معقودة بشكل صحيح. وقد كشفت هذه الاختبارات عن تفاوت كبير في الأداء بين النماذج المختلفة.
نتائج الاختبارات وتفوق نموذج Gemini
أظهرت النتائج أن نموذج “جيميناي” التابع لشركة جوجل، والمبني على تقنية “نانو بانانا برو”، قد تفوق على جميع النماذج الأخرى في معظم الاختبارات. وقد أشاد الخبراء بجودة الصور المولدة ودقتها العالية، بالإضافة إلى قدرة النموذج على فهم طلبات المستخدمين وتنفيذها بشكل فعال. وقد أشار نايك إلى التقدم الملحوظ الذي حققه هذا النموذج في مجال توليد الصور.
في المقابل، جاء نموذج “فايرفلاي” التابع لشركة أدوبي في المرتبة الأخيرة. ويعزى هذا الأداء الضعيف إلى اعتماد النموذج على صور مفتوحة المصدر، مما أثر على جودة المخرجات. بينما قدمت النماذج الأخرى أداءً متفاوتًا، إلا أنها لم تتمكن من مجاراة “جيميناي” في معظم المجالات.
أحد التحديات التي واجهها “جيميناي” يتعلق بحقوق الملكية الفكرية. فقد استخدم النموذج ملامح الممثل ليوناردو دي كابريو عند توليد صورة لممثل آخر، كما أضاف توقيعًا وهميًا ينسب حقوق الصورة إلى وكالة أسوشيتد برس. هذا الأمر أثار انتقادات من لجنة التحكيم، التي أكدت على أهمية احترام حقوق الملكية الفكرية في مجال الذكاء الاصطناعي.
مستقبل الذكاء الاصطناعي في توليد الصور
على الرغم من التحديات، يظل الذكاء الاصطناعي التوليدي مجالًا واعدًا. تشير التغطية إلى أن هذه التكنولوجيا ستستمر في التطور والتحسن، مما سيؤدي إلى ظهور أدوات أكثر قوة وفعالية في المستقبل القريب. من المتوقع أن تشهد هذه الصناعة مزيدًا من الاستثمارات والابتكارات، مما سيساهم في توسيع نطاق استخداماتها وتطبيقاتها.
من المرجح أن تركز الشركات المطورة على تحسين دقة النماذج وقدرتها على توليد صور واقعية، بالإضافة إلى معالجة قضايا حقوق الملكية الفكرية. كما من المتوقع أن يتم تطوير أدوات جديدة تسمح للمستخدمين بالتحكم بشكل أكبر في عملية توليد الصور، وتخصيصها لتلبية احتياجاتهم الخاصة. ستكون التطورات القادمة حاسمة في تحديد مستقبل هذه التكنولوجيا وتأثيرها على صناعة التصوير والفنون الرقمية.






