Nov 19

Почему возникает ощущение, что ваши любимые сайты постоянно падают

Испытываешь проблемы с любимыми сайтами в последнее время? Это не только у тебя.

Поставщик веб-инфраструктуры Cloudflare во вторник столкнулся со сбоем, который временно затронул множество онлайн-сервисов — от Spotify до ChatGPT, а также платформу Truth Social Дональда Трампа. Это уже очередное крупное интернет-падение за последнее время.

Месяц назад сбой в Amazon Web Services нарушил повседневную жизнь миллионов людей, в некоторых случаях не позволяя выполнить даже простые действия — вроде заказа кофе или управления умным домом. А несколькими днями позже произошёл сбой в Microsoft Azure.

По словам экспертов, это признак времени:
— усилившаяся зависимость общества от цифровых сервисов,
— концентрация критически важной облачной инфраструктуры у нескольких компаний,
— склонность людей массово жаловаться на проблемы в соцсетях.

А ещё это показывает, что никто — даже крупнейшие IT-компании — не застрахован от технических сбоев.

«В таких случаях почти не важно, насколько стабилен поставщик или насколько развита IT-инфраструктура у компании», — сказала Айлин Хаггерти, вице-президент по маркетингу продуктов в Netscout. — «Подобные сбои — очень распространённое явление».

Что произошло в Cloudflare

Компания заявила, что сбой произошёл из-за технической проблемы, а не из-за хакерской атаки.

Причиной стал конфигурационный файл, который должен был управлять «вредоносным трафиком».

Этот файл вырос больше ожидаемого, из-за чего произошёл сбой в программном обеспечении, которое обрабатывает трафик ряда сервисов Cloudflare.

CTO компании Дейн Кнект объяснил в X, что обычное изменение конфигурации вызвало баг, который и привёл к «широкому снижению качества работы сети и сервисов».

«Мы уже работаем над тем, чтобы это не повторилось. Знаю, что сегодня это принесло много проблем», — написал он.

Сбой Amazon также был связан с багом — его запустили два автоматизированных процесса, пытавшихся одновременно обновить одни и те же данные.

Почему такие сбои — обычное дело

IT-эксперты говорят, что подобные проблемы весьма распространены.
20 лет назад отключения сервисов встречались постоянно, говорит Майк Чэппл, профессор Notre Dame и бывший специалист NSA:

«Не было бы чем-то необычным прожить рабочую неделю, столкнувшись хотя бы с одним крупным IT-сбоем».

Но теперь все зависят от одних и тех же крупных провайдеров, и сбои в Amazon, Microsoft или Google ощущаются по всему интернету.

Во вторник количество жалоб на интернет-сервисы на Downdetector превысило 2,1 миллиона.

Cloudflare в среднем обрабатывает 81 миллион HTTP-запросов в секунду.

А действительно ли сбои происходят чаще?

То, что за месяц произошло три крупных сбоя — скорее совпадение. Но по ощущениям их действительно стало больше, поскольку их масштаб растёт.

Количество самих сбоев остаётся примерно постоянным, но число сервисов и сайтов, которые зависят от крупных облаков, увеличилось, объясняет Cisco ThousandEyes.

По данным Cisco:

в 2025 году — 12 крупных сбоев (до Cloudflare),

в 2024 — 23,

в 2023 — 13,

в 2022 — 10.

Некоторые тенденции повторяются:
— сбои, распространяющиеся по системам цепной реакцией,
— скрытые ошибки, не проявляющие себя вовремя,
— изменения конфигураций, вызывающие каскады сбоев.

И такие проблемы будут происходить снова.

«Нельзя сказать: “Хорошо, с нами такого точно не случится”», — говорит Хаггерти. — «Подобное может произойти с любой компанией».
Created with