Компанія Cloudflare пояснила причину серйозного збою, який стався 18 листопада і вплинув на роботу багатьох веб-сайтів, включаючи ChatGPT, X і Downdetector. Зазначається, що проблема виникла через помилкове налаштування запиту у базі даних ClickHouse, яка створює конфігураційний файл для системи машинного навчання Bot Management. Це призвело до збільшення обсягу файлу, який перевищив пам’ять. Це спричинило відмову проксі-системи, яка обробляє трафік клієнтів, що взаємодіють з модулем ботів. Це призвело до блокування реального трафіку для деяких клієнтів. Cloudflare заявила, що проблема не пов’язана з DNS або атаками, а була внутрішньою помилкою у логіці оновлення конфігурації Bot Management. Компанія вжила заходів для запобігання подібним інцидентам, включаючи посилення обробки конфігураційних файлів, розширення “kill switch” і перегляд режимів відмови у проксі-модулях. Cloudflare підкреслила, що навіть невелика помилка у їхній мережі може мати глобальний вплив через великий обсяг трафіку, що проходить через їхні сервери.
Cloudflare пояснила причину масштабного збою