نگاهی به قطعی بزرگ کلادفلر و تأثیر آن بر اینترنت

آیا تا به حال فکر کرده‌اید که چرا سه‌شنبه گذشته بخش عظیمی از اینترنت، از جمله برخی از سرویس‌های محبوب شما مانند OpenAI، اسپاتیفای و X، ناگهان از دسترس خارج شدند؟ مقصر این اتفاق، یک قطعی گسترده در کلادفلر بود؛ شرکتی که شاید نامش را نشنیده باشید، اما زیرساخت‌های حیاتی برای حدود ۲۰٪ از کل وب‌سایت‌ها را فراهم می‌کند. این فقط یک اختلال جزئی نبود، بلکه بزرگ‌ترین مشکل این شرکت از سال ۲۰۱۹ تا به امروز بود.

برای چندین ساعت، کاربران در سراسر جهان هنگام تلاش برای دسترسی به مجموعه وسیعی از سایت‌ها و خدمات با خطا مواجه می‌شدند. این حادثه حدود ساعت ۳:۳۰ بامداد به وقت اقیانوس آرام آغاز شد و بیش از سه ساعت طول کشید تا اکثر سرویس‌ها به حالت عادی بازگردند. وب‌سایت Downdetector که برای گزارش قطعی‌ها استفاده می‌شود (و جالب اینکه خود نیز تحت تأثیر قرار گرفته بود)، بیش از ۲.۱ میلیون گزارش در این دوره ثبت کرد. این اثر دومینویی به پلتفرم‌های بزرگی از جمله League of Legends، Canva و Grindr نیز ضربه زد و نشان داد که دنیای دیجیتال ما چقدر به هم پیوسته است.

لوگوی کلادفلر روی صفحه گوشی

چه چیزی باعث این شکست گسترده شد؟

برخلاف سوءظن‌های اولیه مبنی بر یک حمله سایبری بزرگ، کلادفلر تأیید کرد که این قطعی ناشی از یک نقص نرم‌افزاری داخلی بوده است. متیو پرینس، مدیرعامل شرکت، در یک پست وبلاگ مفصل توضیح داد که تغییری در یکی از پایگاه‌های داده شرکت، یک فایل پیکربندی با حجم غیرمنتظره تولید کرده بود. این فایل برای نرم‌افزار خودشان بیش از حد بزرگ بود و باعث از کار افتادن سیستمی شد که جریان ترافیک اصلی را در شبکه آن‌ها متوقف کرد.

تیم مهندسی به سرعت مشکل را شناسایی و با جایگزین کردن فایل معیوب با یک نسخه پایدار و قدیمی‌تر، تغییر را به حالت قبل بازگرداند. تا ساعت ۶:۳۰ بامداد، بیشتر ترافیک به حالت عادی بازگشته بود. پرینس با انتشار یک عذرخواهی صمیمانه اظهار داشت: «ما به خاطر تأثیری که بر مشتریان خود و به طور کلی بر اینترنت گذاشتیم، متاسفیم… هرگونه قطعی در هر یک از سیستم‌های ما غیرقابل قبول است. ما می‌دانیم که امروز شما را ناامید کردیم.»

تصویر بزرگ‌تر: اینترنتی شکننده؟

این رویداد یک یادآوری جدی از «ریسک تمرکز» در اینترنت است. این اتفاق، بسیار شبیه به قطعی‌های قبلی غول‌هایی مانند خدمات وب آمازون (AWS) و CrowdStrike، نشان می‌دهد که اینترنت جهانی چقدر به تعداد انگشت‌شماری از ارائه‌دهندگان زیرساخت کلیدی وابسته است. هنگامی که یکی از این ستون‌ها دچار تزلزل می‌شود، اثر دومینویی آن می‌تواند عظیم باشد و به طور بالقوه صدها میلیون دلار زیان اقتصادی ناشی از عدم فعالیت به بار آورد.

اختلال در خدمات OpenAI به ویژه قابل تأمل بود. این اتفاق نشان داد که حتی صنعت چند تریلیون دلاری هوش مصنوعی با فناوری‌های پیشرفته‌اش، اساساً به پایداری زیرساخت‌های شخص ثالث و کمتر دیده‌شده متکی است. همانطور که یکی از کارشناسان اشاره کرد، این سرمایه‌گذاری عظیم در هوش مصنوعی تنها به اندازه کمترین جزء بررسی‌شده‌اش قابل اعتماد است. این موضوع درس مهمی در مورد اهمیت تاب‌آوری دیجیتال و پیچیدگی‌های پنهانی است که زندگی دیجیتال ما را سرپا نگه می‌دارند.

منبع: CNET

Leave a Comment