سومین قطعی بزرگ اینترنت در یک ماه، تنها نشانهای دیگر است که نشان میدهد وبسایتها به یک طرح پشتیبان نیاز دارند.
سومین قطعی بزرگ اینترنت در یک ماه، تنها نشانهای دیگر است که نشان میدهد وبسایتها به یک طرح پشتیبان نیاز دارند.

کلودفلیر تازهترین غول زیرساخت وب است که در طول یک ماه سقوط کرد و تمام سایتها، از جمله X، ChatGPT، Spotify، Canva و حتی سرویس ردیاب قطعی Downdetector را با پیام خطا برای ساعتها صبح امروز جایگزین کرد. این آخرین مورد از یک سری قطعیهاست که مهدی دائودی، مدیرعامل و همبنیانگذار پلتفرم نظارت بر عملکرد اینترنت Catchpoint، آن را بهعنوان «زنگ هشدار» برای شرکتها میداند.
«همه همه تخممرغهایشان را در یک سبد میگذارند و سپس وقتی مشکلی پیش میآید شگفتزده میشوند»، میگوید دائودی. «مسئولیت این بر عهده شرکت است که اطمینان حاصل کند از تکرارپذیری و مقاومت کافی برخوردار باشد.»
این قطعی پس از بروز مشکلاتی که Microsoft Azure و Amazon Web Services را در طی تنها یک هفته متوالی تحت تأثیر قرار داد، رخ داد و بخشهای بزرگی از اینترنت را که برای حفظ عملکرد وبسایتهای خود به ارائهدهندگان بزرگ متکی بودند، از کار انداخت. کلودفلیر بهطور مشابه بخشی قابلتوجهی از اینترنت را تأمین میکند. این شرکت وبسایتها را با شبکه تحویل محتوا (CDN) خود آنلاین نگه میدارد و خدمات دیگری از جمله حفاظت در برابر حملات DDoS و DNS ارائه میدهد. سال گذشته، این شرکت اعلام کرد که حدود ۲۰٪ از وب از طریق شبکهٔ کلودفلیر عبور میکند. همچنین این شرکت ۳۵٪ از شرکتهای فهرست Fortune 500 را سرویس میدهد، بهعلاوه «میلیونها» مشتری دیگر.
سرعت و رکورد امنیتی بالای کلودفلیر آن را به گزینهای محبوب برای وبسایتها در سراسر جهان تبدیل کرده است، اما این قطعی اخیر به تمرکز فزاینده صنعت زیرساخت وب اشاره میکند. پس از آنکه قطعی AWS برنامه پیامرسان امن Signal را از کار انداخت، مرسدیت ویتاکر، رئیس سرویس، گفت شرکت چارهای جز استفاده از یک ارائهکنندهٔ بزرگ خدمات ابری نداشت. او نوشت: «بهطور عملی، تمام لایهها توسط ۳‑۴ بازیکن در اختیار هستند.»
«حتی انحرافهای کوچک میتوانند عواقب عظیمی داشته باشند.»
اما حتی با اینکه شرکتها به تعداد کمی از ارائهدهندگان زیرساخت وب متکی هستند، زنجیرهٔ اخیر قطعیها نشان میدهد که آنها به طرح پشتیبان نیاز دارند. «قطعها ادامه خواهند یافت و بهصورت مداوم بیشتر میشوند. دامنهٔ اثر آنها نیز در حال گسترش است»، مهدی دائودی به The Verge میگوید. «سؤال این است که، شما چه اقداماتی برای مقابله با آن انجام میدهید؟»
اگرچه مایکروسافت و AWS قطعهای خود را به مسائلی مرتبط با DNS — سیستمی که نام دامنهٔ وبسایتها را به آدرسهای IP تبدیل میکند — نسبت دادند، کلودفلیر علت قطع خود را به یک فایل واحد ردیابی کرد. «دلیل اصلی این قطع، یک فایل پیکربندی بود که بهصورت خودکار برای مدیریت ترافیک تهدیدی تولید میشود»، به گفته سخنگوی کلودفلیر جکی داتن. «این فایل بیش از اندازهٔ مورد انتظار ورودیها رشد کرد و منجر به سقوط در سیستم نرمافزاری شد که ترافیک چندین سرویس کلودفلیر را مدیریت میکند.»
ممکن است عجیبی به نظر برسد که یک مشکل در یک فایل بتواند بخشهای بزرگی از اینترنت را از کار بیندازد، اما برای شرکتی بهاندازهٔ کلودفلیر این امر میتواند رخ دهد. «وقتی زیرساخت را در مقیاس کلودفلیر اداره میکنید، حتی انحرافات کوچک میتوانند عواقب عظیمی داشته باشند»، راب لی، رئیس هوش مصنوعی و تحقیقات در مؤسسه SANS، به The Verge میگوید. «این پلتفرمها برای سرعت طراحی شدهاند، بنابراین هر چیزی که تصمیمگیری را به تأخیر بیندازد یا متوقف کند، میتواند بهسرعت بهصورت زنجیرهای گسترش یابد. در محیطهای با عملکرد بالا، یک میلیثانیه تأخیر میتواند به توقف کامل ترافیک منجر شود.»
بهنظری لی، فایلی پیکربندی مانند آنچه کلودفلیر توصیف میکند، «سیاستهای امنیتی مسیریابی، تصمیمات تعادل بار، و توزیع ترافیک بهصورت سراسری را هدایت میکند». اگر این فایل ناگهان در اندازه افزایش یابد، «میتواند باعث پردازش کندتر، مشکلات حافظه، رقابت پردازشگر (CPU) یا شکستهای منطقی در سیستمهای متکی به آن شود»، لی اضافه میکند.
AWS نیز مقصر «اتوماسیون معیوب» را برای بروز زنجیرهای از مشکلات که منجر به آخرین قطعی گستردهٔ آن شد، اعلام کرد — نوع خطایی که احتمال تکرار دارد. «آیا هر بار که کلودفلیر عطسه میکند، نسبت به آن شکایت میکنید؟» میگوید دائودی. «یا قصد دارید راهحلهای خود را دور آن بسازید؟»
دیدگاهتان را بنویسید