لذلك ، هناك بيانات التدريب. ثم ، هناك صقل وتقييم. قد تحتوي بيانات التدريب على جميع أنواع الصور النمطية إشكالية حقًا عبر البلدان ، ولكن بعد ذلك قد تنظر تقنيات التخفيف من التحيز إلى اللغة الإنجليزية فقط. على وجه الخصوص ، يميل إلى أن تكون أمريكا الشمالية-والولايات المتحدة. على الرغم من أنك قد تقلل من التحيز بطريقة ما للمستخدمين الإنجليز في الولايات المتحدة ، إلا أنك لم تفعل ذلك في جميع أنحاء العالم. لا تزال تخاطر بتضخيم وجهات نظر ضارة حقًا على مستوى العالم لأنك ركزت على اللغة الإنجليزية فقط.

هل تقدم الذكاء الاصطناعي التوليدي صورًا نمطية جديدة للغات والثقافات المختلفة؟

هذا جزء مما نجده. إن فكرة أن تكون الشقراوات غبية ليست شيئًا موجودًا في جميع أنحاء العالم ، ولكن توجد في الكثير من اللغات التي نظرنا إليها.

عندما يكون لديك جميع البيانات في مساحة كامنة مشتركة ، يمكن نقل المفاهيم الدلالية عبر اللغات. أنت تخاطر بنشر الصور النمطية الضارة التي لم يفكر بها الآخرون.

هل صحيح أن نماذج الذكاء الاصطناعى ستبرر في بعض الأحيان الصور النمطية في مخرجاتها بمجرد جعل القرف؟

كان هذا شيئًا خرج في مناقشاتنا حول ما وجدناه. كنا جميعًا من الغريب أن بعض الصور النمطية كانت مبررة من خلال الإشارات إلى الأدبيات العلمية غير الموجودة.

المخرجات التي تقول إنه ، على سبيل المثال ، أظهر العلم اختلافات وراثية حيث لم يتم عرضه ، وهو أساس للعنصرية العلمية. كانت مخرجات الذكاء الاصطناعي تضع هذه الآراء العلمية الزائفة ، ثم تستخدم أيضًا اللغة التي اقترحت الكتابة الأكاديمية أو الدعم الأكاديمي. لقد تحدث عن هذه الأشياء كما لو كانت حقائق ، عندما لا تكون واقعية على الإطلاق.

ما هي بعض من أكبر التحديات عند العمل على مجموعة بيانات الظلال؟

كان أحد أكبر التحديات حول الاختلافات اللغوية. هناك نهج شائع حقًا لتقييم التحيز هو استخدام اللغة الإنجليزية وجعل جملة مع فتحة مثل: “الناس من (أمة) غير جديرة بالثقة “. ثم ، تقلب في دول مختلفة.

عندما تبدأ في وضع الجنس ، يبدأ بقية الجملة الآن إلى الاتفاق بشكل نحوي على الجنس. لقد كان هذا حقًا قيدًا لتقييم التحيز ، لأنه إذا كنت ترغب في القيام بهذه المقايضات المتناقضة بلغات أخرى – وهي مفيدة للغاية لقياس التحيز – يجب أن تتغير بقية الجملة. تحتاج إلى ترجمات مختلفة حيث تتغير الجملة بأكملها.

كيف تصنع قوالب حيث تحتاج الجملة بأكملها إلى الاتفاق على الجنس ، في العدد ، في التعددية ، وكل هذه الأنواع المختلفة من الأشياء بهدف الصورة النمطية؟ كان علينا التوصل إلى شرحنا اللغوي الخاص بنا من أجل حساب ذلك. لحسن الحظ ، كان هناك عدد قليل من الأشخاص المعنيين الذين كانوا مهووسين لغويين.

لذا ، يمكنك الآن القيام بهذه العبارات المتناقضة عبر جميع هذه اللغات ، حتى تلك التي لديها قواعد الاتفاق الصعبة حقًا ، لأننا قمنا بتطوير هذه الرواية القائمة على القالب لتقييم التحيز الذي يعاني من حساسية.

من المعروف أن الذكاء الاصطناعي التوليدي لتضخيم الصور النمطية لفترة من الوقت الآن. مع إجراء الكثير من التقدم في جوانب أخرى من أبحاث الذكاء الاصطناعي ، لماذا لا تزال هذه الأنواع من التحيزات الشديدة سائدة؟ إنها قضية تبدو غير مضغوطة.

هذا سؤال كبير جدا. هناك بعض أنواع الإجابات المختلفة. واحد ثقافي. أعتقد أنه في كثير من شركات التكنولوجيا ، يعتقد أن الأمر ليس مشكلة كبيرة في الحقيقة. أو ، إذا كان الأمر كذلك ، فهو إصلاح بسيط للغاية. ما سيتم تحديد أولوياته ، إذا تم تحديد أولويات أي شيء ، فهل هذه الأساليب البسيطة التي يمكن أن تسوء.

سنحصل على إصلاحات سطحية للأشياء الأساسية للغاية. إذا قلت فتيات مثل Pink ، فإنه يدرك أنه كقوال نمطية ، لأنه مجرد نوع من الشيء الذي إذا كنت تفكر في الصور النمطية النموذجية تنبثق عليك ، أليس كذلك؟ سيتم التعامل مع هذه الحالات الأساسية للغاية. إنه نهج بسيط للغاية وسطحي حيث لا يتم معالجة هذه المعتقدات المضمنة بعمق.

ينتهي الأمر إلى أن تكون قضية ثقافية وقضية فنية لإيجاد كيفية الحصول على تحيزات متأصلة بعمق لا تعبر عن نفسها بلغة واضحة للغاية.

شاركها.