آیا تا به حال فکر کردهاید که چرا سهشنبه گذشته بخش عظیمی از اینترنت، از جمله برخی از سرویسهای محبوب شما مانند OpenAI، اسپاتیفای و X، ناگهان از دسترس خارج شدند؟ مقصر این اتفاق، یک قطعی گسترده در کلادفلر بود؛ شرکتی که شاید نامش را نشنیده باشید، اما زیرساختهای حیاتی برای حدود ۲۰٪ از کل وبسایتها را فراهم میکند. این فقط یک اختلال جزئی نبود، بلکه بزرگترین مشکل این شرکت از سال ۲۰۱۹ تا به امروز بود.
برای چندین ساعت، کاربران در سراسر جهان هنگام تلاش برای دسترسی به مجموعه وسیعی از سایتها و خدمات با خطا مواجه میشدند. این حادثه حدود ساعت ۳:۳۰ بامداد به وقت اقیانوس آرام آغاز شد و بیش از سه ساعت طول کشید تا اکثر سرویسها به حالت عادی بازگردند. وبسایت Downdetector که برای گزارش قطعیها استفاده میشود (و جالب اینکه خود نیز تحت تأثیر قرار گرفته بود)، بیش از ۲.۱ میلیون گزارش در این دوره ثبت کرد. این اثر دومینویی به پلتفرمهای بزرگی از جمله League of Legends، Canva و Grindr نیز ضربه زد و نشان داد که دنیای دیجیتال ما چقدر به هم پیوسته است.

چه چیزی باعث این شکست گسترده شد؟
برخلاف سوءظنهای اولیه مبنی بر یک حمله سایبری بزرگ، کلادفلر تأیید کرد که این قطعی ناشی از یک نقص نرمافزاری داخلی بوده است. متیو پرینس، مدیرعامل شرکت، در یک پست وبلاگ مفصل توضیح داد که تغییری در یکی از پایگاههای داده شرکت، یک فایل پیکربندی با حجم غیرمنتظره تولید کرده بود. این فایل برای نرمافزار خودشان بیش از حد بزرگ بود و باعث از کار افتادن سیستمی شد که جریان ترافیک اصلی را در شبکه آنها متوقف کرد.
تیم مهندسی به سرعت مشکل را شناسایی و با جایگزین کردن فایل معیوب با یک نسخه پایدار و قدیمیتر، تغییر را به حالت قبل بازگرداند. تا ساعت ۶:۳۰ بامداد، بیشتر ترافیک به حالت عادی بازگشته بود. پرینس با انتشار یک عذرخواهی صمیمانه اظهار داشت: «ما به خاطر تأثیری که بر مشتریان خود و به طور کلی بر اینترنت گذاشتیم، متاسفیم… هرگونه قطعی در هر یک از سیستمهای ما غیرقابل قبول است. ما میدانیم که امروز شما را ناامید کردیم.»
تصویر بزرگتر: اینترنتی شکننده؟
این رویداد یک یادآوری جدی از «ریسک تمرکز» در اینترنت است. این اتفاق، بسیار شبیه به قطعیهای قبلی غولهایی مانند خدمات وب آمازون (AWS) و CrowdStrike، نشان میدهد که اینترنت جهانی چقدر به تعداد انگشتشماری از ارائهدهندگان زیرساخت کلیدی وابسته است. هنگامی که یکی از این ستونها دچار تزلزل میشود، اثر دومینویی آن میتواند عظیم باشد و به طور بالقوه صدها میلیون دلار زیان اقتصادی ناشی از عدم فعالیت به بار آورد.
اختلال در خدمات OpenAI به ویژه قابل تأمل بود. این اتفاق نشان داد که حتی صنعت چند تریلیون دلاری هوش مصنوعی با فناوریهای پیشرفتهاش، اساساً به پایداری زیرساختهای شخص ثالث و کمتر دیدهشده متکی است. همانطور که یکی از کارشناسان اشاره کرد، این سرمایهگذاری عظیم در هوش مصنوعی تنها به اندازه کمترین جزء بررسیشدهاش قابل اعتماد است. این موضوع درس مهمی در مورد اهمیت تابآوری دیجیتال و پیچیدگیهای پنهانی است که زندگی دیجیتال ما را سرپا نگه میدارند.
منبع: CNET