Site icon السعودية برس

ما يكشفه انقطاع AWS الضخم عن الإنترنت

سحابة ضخمة تسبب الانقطاع الناجم عن منطقة US-EAST-1 الرئيسية لشركة Amazon Web Services، ومركزها في شمال فيرجينيا، بالقرب من مبنى الكابيتول الأمريكي، في اضطرابات واسعة النطاق لمواقع الويب والمنصات في جميع أنحاء العالم صباح يوم الاثنين. عانت منصة التجارة الإلكترونية الرئيسية لشركة أمازون وغيرها من الممتلكات، بما في ذلك أجراس الباب Ring ومساعد Alexa الذكي، من الانقطاعات والانقطاعات طوال الصباح، كما حدث مع منصة اتصالات Meta التابعة لشركة Meta، وChatGPT من OpenAI، ومنصة الدفع Venmo من PayPal، وخدمات الويب المتعددة من Epic Games، والعديد من المواقع الحكومية البريطانية، وغيرها الكثير.

نشأ الانقطاع عن واجهات برمجة تطبيقات قاعدة بيانات DynamoDB الخاصة بأمازون في US-EAST-1، وقالت AWS في تحديثات الحالة أن المشكلة تتعلق على وجه التحديد بمشكلات حل DNS. “نظام اسم المجال” هو خدمة إنترنت أساسية تعمل بشكل أساسي كبحث تلقائي في دليل الهاتف لترجمة عناوين URL على الويب مثل www.wired.com إلى عناوين IP للخادم الرقمي حتى تعرض متصفحات الويب للمستخدمين المحتوى الصحيح. تحدث مشكلات دقة DNS عندما لا تقوم خوادم DNS بتوصيل هذه النقاط بدقة، وللحفاظ على تشبيه دليل الهاتف، فإنها توفر أرقامًا خاطئة لاسم معين، أو العكس.

وكتبت AWS في تحديثات الحالة يوم الاثنين: “استنادًا إلى تحقيقنا، يبدو أن المشكلة مرتبطة بحل DNS لنقطة نهاية DynamoDB API في US-EAST-1”. بعد فترة وجيزة، أضافت الشركة: “إذا كنت لا تزال تواجه مشكلة في حل نقاط نهاية خدمة DynamoDB في US-EAST-1، فإننا نوصي بمسح ذاكرة التخزين المؤقت لنظام أسماء النطاقات لديك.”

لم يستجب المتحدث باسم AWS على الفور عندما سئل عن تفاصيل حول طبيعة الفشل. يمكن أن تكون مشكلات تحليل DNS ضارة — تُعرف باسم اختطاف DNS — ولكن لا يوجد ما يشير إلى أن انقطاعات AWS يوم الاثنين كانت شائنة.

يقول دافي أوتينهايمر، مدير العمليات الأمنية والامتثال منذ فترة طويلة ونائب الرئيس في شركة Inrupt للبنية التحتية للبيانات: “عندما لم يتمكن النظام من تحديد الخادم الذي سيتم الاتصال به بشكل صحيح، أدت حالات الفشل المتتالية إلى تعطيل الخدمات عبر الإنترنت”. “يعد انقطاع خدمة AWS اليوم مشكلة توفر كلاسيكية، ونحن بحاجة إلى البدء في رؤيتها على أنها فشل في تكامل البيانات.”

بدأت المشاكل حوالي الساعة 3 صباحًا بالتوقيت الشرقي. بحلول الساعة 5:22 صباحًا، كانت AWS قد طبقت “عمليات التخفيف الأولية” التي بدأت تدخل حيز التنفيذ. في الساعة 6:35 صباحًا، قالت أمازون إنها عالجت المشكلات الفنية الأساسية بشكل كامل، لكن “بعض الخدمات سيكون لديها تراكم للعمل، الأمر الذي قد يستغرق وقتًا إضافيًا للمعالجة الكاملة”.

عانت AWS من انقطاعات أخرى واسعة النطاق، بما في ذلك حادث كبير في عام 2023. وقد أدى الاعتماد على الخدمات السحابية المركزية من عمالقة مثل AWS وMicrosoft Azure وGoogle Cloud Services، بطرق عديدة، إلى تحسين الأمن السيبراني والاستقرار في جميع أنحاء العالم من خلال إنشاء خط أساسي من حواجز الحماية وأفضل الممارسات لجميع العملاء. لكن هذا التوحيد يأتي مصحوبا بمقايضات كبرى، لأن المنصات تصبح نقطة فشل واحدة لمجموعات كبيرة من الخدمات الحيوية.

يقول أوتينهايمر: “إن الإخفاقات ترجع بشكل متزايد إلى النزاهة”. “البيانات الفاسدة، أو فشل التحقق من الصحة، أو، في هذه الحالة، تحليل الأسماء المعطوب الذي سمم كل تبعية المصب. وإلى أن نفهم ونحمي النزاهة بشكل أفضل، فإن تركيزنا الكامل على وقت التشغيل هو مجرد وهم.”

Exit mobile version