إذا فكرت في أي موضوع مرتبط بتربية الأطفال، فربما تجد منشورًا عنه على موقع Mumsnet، وهو منتدى تربية الأطفال الذي يقع في المملكة المتحدة والذي يحظى بشعبية كبيرة ويثير الجدل منذ فترة طويلة. وعلى مدار تاريخه الذي يمتد لأكثر من عقدين من الزمان، جمع موقع Mumsnet أرشيفًا يضم أكثر من ستة مليارات كلمة كتبها مستخدموه المنخرطون بشدة في مواضيع مثل الحفاضات المتسخة والأزواج الكسالى. (ناهيك عن الهذيان المجنون حول الدلافين).
وفي هذا الربيع، بعد أن اكتشفت Mumsnet أن شركات الذكاء الاصطناعي كانت تستخرج بياناتها، قالت الشركة إنها قررت محاولة إبرام صفقات ترخيص مع بعض اللاعبين الرئيسيين في هذا المجال، بما في ذلك OpenAI، التي أعربت في البداية عن استعدادها لاستكشاف ترتيب بعد أن تواصلت Mumsnet معها لأول مرة. وبعد انهيار المحادثات مع OpenAI، أعلنت Mumsnet في يوليو/تموز عن نيتها اتخاذ إجراء قانوني.
وفقًا لـ Mumsnet، خلال تلك المحادثات المبكرة، أخبر أحد قادة الشراكة الاستراتيجية في OpenAI الشركة أن مجموعات البيانات التي تزيد عن مليار كلمة كانت محل اهتمام عملاق الذكاء الاصطناعي. كانت قيادة Mumsnet متحمسة. تقول جوستين روبرتس، مؤسسة Mumsnet والرئيسة التنفيذية لها لموقع WIRED: “لقد أمضينا بعض الوقت في تبادل الآراء معهم”. “كان علينا توقيع بعض اتفاقيات عدم الإفصاح، وكانوا يريدون الكثير من المعلومات منا”.
ومع ذلك، بعد أكثر من شهر، أخبرت شركة OpenAI موقع Mumsnet أن الشركة لم تعد مهتمة بالشراكة في ذلك الوقت، وفقًا لتبادل رسائل البريد الإلكتروني الذي استعرضته WIRED. وعندما سُئل عن السبب، وصف موظف OpenAI مجموعة بيانات Mumsnet التي يبلغ عددها 6 مليارات كلمة بأنها صغيرة جدًا بحيث لا تستحق ترتيب الترخيص، كما يقول روبرتس. كما لاحظوا أن OpenAI مهتمة في المقام الأول بمجموعات البيانات الكبيرة التي لا يستطيع الجمهور الوصول إليها عبر الإنترنت بالفعل، وأنها تريد مجموعات بيانات تلتقط تجربة إنسانية واسعة النطاق.
وقد رددت الشركة هذا الرأي عندما طلبت منها WIRED التعليق. تقول المتحدثة باسم OpenAI، كايلا وود: “نحن نسعى إلى إقامة شراكات لمجموعات البيانات واسعة النطاق التي تعكس المجتمع البشري ولا نسعى إلى إقامة شراكات فقط للحصول على معلومات متاحة للجمهور. نحن ندعم اختيار الناشر والمبدع، ونقدم لهم طرقًا للتعبير عن تفضيلاتهم حول كيفية عمل مواقعهم ومحتواهم مع الذكاء الاصطناعي في نتائج البحث وتدريب نماذج الأساس التوليدية للذكاء الاصطناعي”.
وتقول روبرتس إنها شعرت “بالانزعاج” من هذا التطور. وتتذكر أن شركة OpenAI بدت في البداية مهتمة بشكل خاص بـ Mumsnet بسبب المحتوى المكتوب من قبل النساء بشكل كبير على المنصة. وتقول: “إنها بيانات محادثة عالية الجودة للغاية. إنها محادثة نسائية بنسبة 90 في المائة، وهو أمر غير معتاد تمامًا”.
أبرمت شركة OpenAI مجموعة متنوعة من صفقات ترخيص البيانات مع منافذ ومنصات إعلامية في العام الماضي، حيث دخلت في اتفاقيات مع Vox Media، الأطلسيوAxel Springer وTime والشركة الأم لـ WIRED Condé Nast، بالإضافة إلى منصات مليئة بالمحتوى الذي ينشئه المستخدمون مثل Reddit. (قيل أيضًا إن Automattic، مالك WordPress.com وTumblr، كانت في محادثات ترخيص في وقت سابق من هذا العام). نظرًا لأن تفاصيل هذه الصفقات لم يتم الكشف عنها، فليس من الواضح ما هو حجم مجموعاتها الخاصة.
عندما سألت مجلة WIRED عن حجم مجموعات البيانات التي ستنظر فيها للحصول على تراخيص تجارية، رفضت OpenAI مشاركة هذه المعلومات. لكن المتحدثة باسم الشركة كايلا وود أكدت أن شراكات الشركة مع الناشرين “تركز على عرض محتواهم في منتجاتنا وتوجيه الزيارات إليهم”.