Cloudflare نشان می‌دهد که قطعی‌های اینترنتی مسأله‌ای از نوع «آیا» نیستند — بلکه «چه‌وقت» است

سومین قطعی بزرگ اینترنت در یک ماه، تنها نشانه‌ای دیگر است که نشان می‌دهد وب‌سایت‌ها به یک طرح پشتیبان نیاز دارند.

سومین قطعی بزرگ اینترنت در یک ماه، تنها نشانه‌ای دیگر است که نشان می‌دهد وب‌سایت‌ها به یک طرح پشتیبان نیاز دارند.

نماد خطا

کلودفلیر تازه‌ترین غول زیرساخت وب است که در طول یک ماه سقوط کرد و تمام سایت‌ها، از جمله X، ChatGPT، Spotify، Canva و حتی سرویس ردیاب قطعی Downdetector را با پیام خطا برای ساعت‌ها صبح امروز جایگزین کرد. این آخرین مورد از یک سری قطعی‌هاست که مهدی دائودی، مدیرعامل و هم‌بنیان‌گذار پلتفرم نظارت بر عملکرد اینترنت Catchpoint، آن را به‌عنوان «زنگ هشدار» برای شرکت‌ها می‌داند.

«همه همه تخم‌مرغ‌هایشان را در یک سبد می‌گذارند و سپس وقتی مشکلی پیش می‌آید شگفت‌زده می‌شوند»، می‌گوید دائودی. «مسئولیت این بر عهده شرکت است که اطمینان حاصل کند از تکرارپذیری و مقاومت کافی برخوردار باشد.»

این قطعی پس از بروز مشکلاتی که Microsoft Azure و Amazon Web Services را در طی تنها یک هفته متوالی تحت تأثیر قرار داد، رخ داد و بخش‌های بزرگی از اینترنت را که برای حفظ عملکرد وب‌سایت‌های خود به ارائه‌دهندگان بزرگ متکی بودند، از کار انداخت. کلودفلیر به‌طور مشابه بخشی قابل‌توجهی از اینترنت را تأمین می‌کند. این شرکت وب‌سایت‌ها را با شبکه تحویل محتوا (CDN) خود آنلاین نگه می‌دارد و خدمات دیگری از جمله حفاظت در برابر حملات DDoS و DNS ارائه می‌دهد. سال گذشته، این شرکت اعلام کرد که حدود ۲۰٪ از وب از طریق شبکهٔ کلودفلیر عبور می‌کند. همچنین این شرکت ۳۵٪ از شرکت‌های فهرست Fortune 500 را سرویس می‌دهد، به‌علاوه «میلیون‌ها» مشتری دیگر.

سرعت و رکورد امنیتی بالای کلودفلیر آن را به گزینه‌ای محبوب برای وب‌سایت‌ها در سراسر جهان تبدیل کرده است، اما این قطعی اخیر به تمرکز فزاینده صنعت زیرساخت وب اشاره می‌کند. پس از آن‌که قطعی AWS برنامه پیام‌رسان امن Signal را از کار انداخت، مرسدیت ویتاکر، رئیس سرویس، گفت شرکت چاره‌ای جز استفاده از یک ارائه‌کنندهٔ بزرگ خدمات ابری نداشت. او نوشت: «به‌طور عملی، تمام لایه‌ها توسط ۳‑۴ بازیکن در اختیار هستند.»

«حتی انحراف‌های کوچک می‌توانند عواقب عظیمی داشته باشند.»

اما حتی با این‌که شرکت‌ها به تعداد کمی از ارائه‌دهندگان زیرساخت وب متکی هستند، زنجیرهٔ اخیر قطعی‌ها نشان می‌دهد که آن‌ها به طرح پشتیبان نیاز دارند. «قطع‌ها ادامه خواهند یافت و به‌صورت مداوم بیشتر می‌شوند. دامنهٔ اثر آن‌ها نیز در حال گسترش است»، مهدی دائودی به The Verge می‌گوید. «سؤال این است که، شما چه اقداماتی برای مقابله با آن انجام می‌دهید؟»

اگرچه مایکروسافت و AWS قطع‌های خود را به مسائلی مرتبط با DNS — سیستمی که نام دامنهٔ وب‌سایت‌ها را به آدرس‌های IP تبدیل می‌کند — نسبت دادند، کلودفلیر علت قطع خود را به یک فایل واحد ردیابی کرد. «دلیل اصلی این قطع، یک فایل پیکربندی بود که به‌صورت خودکار برای مدیریت ترافیک تهدیدی تولید می‌شود»، به گفته سخنگوی کلودفلیر جکی داتن. «این فایل بیش از اندازهٔ مورد انتظار ورودی‌ها رشد کرد و منجر به سقوط در سیستم نرم‌افزاری شد که ترافیک چندین سرویس کلودفلیر را مدیریت می‌کند.»

ممکن است عجیبی به نظر برسد که یک مشکل در یک فایل بتواند بخش‌های بزرگی از اینترنت را از کار بیندازد، اما برای شرکتی به‌اندازهٔ کلودفلیر این امر می‌تواند رخ دهد. «وقتی زیرساخت را در مقیاس کلودفلیر اداره می‌کنید، حتی انحرافات کوچک می‌توانند عواقب عظیمی داشته باشند»، راب لی، رئیس هوش مصنوعی و تحقیقات در مؤسسه SANS، به The Verge می‌گوید. «این پلتفرم‌ها برای سرعت طراحی شده‌اند، بنابراین هر چیزی که تصمیم‌گیری را به تأخیر بیندازد یا متوقف کند، می‌تواند به‌سرعت به‌صورت زنجیره‌ای گسترش یابد. در محیط‌های با عملکرد بالا، یک میلی‌ثانیه تأخیر می‌تواند به توقف کامل ترافیک منجر شود.»

به‌نظری لی، فایلی پیکربندی مانند آنچه کلودفلیر توصیف می‌کند، «سیاست‌های امنیتی مسیریابی، تصمیمات تعادل بار، و توزیع ترافیک به‌صورت سراسری را هدایت می‌کند». اگر این فایل ناگهان در اندازه افزایش یابد، «می‌تواند باعث پردازش کندتر، مشکلات حافظه، رقابت پردازشگر (CPU) یا شکست‌های منطقی در سیستم‌های متکی به آن شود»، لی اضافه می‌کند.

AWS نیز مقصر «اتوماسیون معیوب» را برای بروز زنجیره‌ای از مشکلات که منجر به آخرین قطعی گستردهٔ آن شد، اعلام کرد — نوع خطایی که احتمال تکرار دارد. «آیا هر بار که کلودفلیر عطسه می‌کند، نسبت به آن شکایت می‌کنید؟» می‌گوید دائودی. «یا قصد دارید راه‌حل‌های خود را دور آن بسازید؟»

دیدگاه‌ها

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *