في نهايةالمطاف في شهر أغسطس، أعلنت شركة الذكاء الاصطناعي Anthropic أن برنامج الدردشة الآلي الخاص بها Claude لن يساعد أي شخص في بناء سلاح نووي. وفقًا لـ Anthropic، فقد دخلت في شراكة مع وزارة الطاقة (DOE) والإدارة الوطنية للأمن النووي (NNSA) للتأكد من أن كلود لن يكشف أسرارًا نووية.
إن تصنيع الأسلحة النووية هو علم دقيق ومشكلة محلولة. الكثير من المعلومات حول الأسلحة النووية الأمريكية الأكثر تقدمًا هي معلومات سرية للغاية، لكن العلم النووي الأصلي عمره 80 عامًا. لقد أثبتت كوريا الشمالية أن دولة مكرسة لها مصلحة في الحصول على القنبلة النووية يمكنها أن تفعل ذلك، ولم تكن في حاجة إلى مساعدة روبوت الدردشة.
كيف عملت حكومة الولايات المتحدة بالضبط مع شركة ذكاء اصطناعي للتأكد من أن برنامج الدردشة الآلي لا يفشي أسرارًا نووية حساسة؟ وأيضًا: هل كان هناك خطر من أن يساعد برنامج الدردشة الآلي شخصًا ما في بناء سلاح نووي في المقام الأول؟
الجواب على السؤال الأول هو أنه استخدم أمازون. الجواب على السؤال الثاني معقد.
تقدم Amazon Web Services (AWS) خدمات سحابية سرية للغاية للعملاء الحكوميين حيث يمكنهم تخزين المعلومات الحساسة والمصنفة. كان لدى وزارة الطاقة بالفعل العديد من هذه الخوادم عندما بدأت العمل مع Anthropic.
وقالت مارينا فافارو، التي تشرف على سياسة الأمن القومي والشراكات في Anthropic، لمجلة WIRED: “لقد قمنا بنشر نسخة حدودية من كلود في ذلك الوقت في بيئة سرية للغاية حتى تتمكن NNSA من اختبار منهجي ما إذا كانت نماذج الذكاء الاصطناعي يمكن أن تخلق أو تفاقم المخاطر النووية”. “منذ ذلك الحين، قامت NNSA بتشكيل فريق أحمر لنماذج Claude المتعاقبة في بيئتها السحابية الآمنة وتزويدنا بالتعليقات.”
ساعدت عملية تشكيل الفريق الأحمر التابعة للإدارة الوطنية للأمن النووي – أي اختبار نقاط الضعف – العلماء النوويين في الأنثروبيك والأمريكيين على تطوير حل استباقي للبرامج النووية المدعومة ببرامج الدردشة الآلية. يقول فافارو: “لقد قاموا معًا “بتطوير مصنف نووي، والذي يمكنك التفكير فيه كمرشح متطور لمحادثات الذكاء الاصطناعي”. “لقد قمنا ببنائها باستخدام قائمة طورتها إدارة الأمن النووي لمؤشرات المخاطر النووية، وموضوعات محددة، وتفاصيل فنية تساعدنا على تحديد متى قد تنحرف المحادثة إلى منطقة ضارة. يتم التحكم في القائمة نفسها ولكنها ليست سرية، وهو أمر بالغ الأهمية، لأنه يعني أن موظفينا الفنيين والشركات الأخرى يمكنهم تنفيذها. “
يقول فافارو إن الأمر استغرق أشهرًا من التغيير والتبديل والاختبار حتى يعمل المصنف. وتقول: “إنه يلتقط المحادثات المثيرة للقلق دون الإشارة إلى المناقشات المشروعة حول الطاقة النووية أو النظائر الطبية”.