Cloudflare’ın 6 saate yakın sıkıntı yaşamasının üzerinden henüz 15 gün geçti ama bugün yeniden sıkıntılı bir dengesizlik yaşandı. Kesinti yaklaşık 25 dakika sürdü, bazı raporlara göre trafiğin yaklaşık %20-30’unu etkiledi. Ancak ilerleyen saatlerde de kısa süreli sıkıntılar gözüküyor.
Şirket tarafından yapılan resmi açıklamalara göre bu bir saldırıdan değil, tamamen Cloudflare’ın kendi içindeki teknik sorunlardan kaynaklandı.
Ama sadece 15 gün sonra neden tekrar oldu? Bu pek çok kuruluş –ki hizmet alan pek çok kuruluş var– ve insan tarafından soruluyor.
Ağ izleme noktaları, HTTP 5XX hataları ve arka uç hizmet arızaları gözlemledi ve bu da sorunun basit bir yönlendirme ve gecikme sorunundan daha dahili olduğunu gösterdi.
18 Kasım’daki çöküşün nedeni, aşırı büyüyen bir konfigürasyon dosyası olarak açıklanmıştı. Cloudflare resmi açıklaması şöyleydi :
“Bot yönetimi ve trafik yönetimi için kullanılan ve otomatik oluşturulan bir konfigürasyon dosyası, beklenenden çok daha fazla büyüdü.”
Bu büyük dosya Cloudflare’ın çekirdek hizmetlerinde hata yarattı.
Sonuç olarak 18 kasımda tüm dünyada yüz binlerce site (ChatGPT, Twitter, AP News, vs.) aynı anda çöktü. Bu bir saldırı değildi, tamamen Cloudflare’ın kendi yapılandırma sistemindeki bir hata zinciriydi.
Bugün 5 Aralık yani 15 gün sonra ise çöküşünün nedeni: WAF güncellemesi & güvenlik düzeltmesi olarak veriliyor.
“Cloudflare, ortaya çıkan bir güvenlik açığı nedeniyle WAF (Web Application Firewall) üzerinde bir acil güncelleme yaptı. WAF’ın istek işleme mantığındaki değişiklik, beklenmedik şekilde bazı bölgelerde yoğun hata üretmeye başladı. Bu da yine dünya genelinde kesintilere yol açtı.”
Cloudflare CTO’su açıkça şunu söyledi:
“İnterneti yine hayal kırıklığına uğrattık. Sorun bizden kaynaklandı.”
Yani bu da bir saldırı değil, şirketin kendi içsel trafik yönetimi ve güncelleme sorunlarından kaynaklanan bir kesinti olarak tanımlandı.
Peki neden bu kadar sık oluyor?
Cloudflare’ın sık çökmesinin 4 temel nedeni var:
- Aşırı karmaşık altyapı :Cloudflare, dünya trafiğinin %20–30’unu bir noktada işleyen dev bir CDN + DNS + güvenlik platformu. Bu kadar büyük yapılarda küçük bir konfigürasyon hatası, global etki yaratabiliyor.
- Ölçek etkisi nedeniyle “self-DoS” riski : Çok küçük bir hata bile trafiğin bir anda çığ gibi büyümesine yol açıyor.
- Güvenlik yamaları risk taşıyor : WAF, DDoS koruma, bot yönetimi, DNS yönlendirme gibi modüllerde yapılan anlık değişiklikler bazen yan etki oluşturuyor.
- Tek nokta kritikliği : Cloudflare global olarak dağıtık olsa da, bazı modüllerindeki bir bozulma zincirleme şekilde geniş alanları etkiliyor.
Yani 18 Kasım’da ve 5 aralıkta Cloudflare’in 2 kere çökmesinin temelinde, mimarisindeki iki ayrı noktada oluşan içsel hata var;
18 Kasım : Aşırı büyüyen konfigürasyon dosyası (bot yönetimi)
5 Aralık : WAF güncellemesinin yan etkisi (güvenlik odaklı değişiklik)
Bu bir siber saldırı değildi ama yine de tek bir global altyapının arızasının tüm internet nasıl etkilediği görülüyor. Bu, dijital egemenlik ve altyapı bağımsızlığı tartışmalarını güçlendiriyor.
Yani Multi-CDN ve multi-DNS artık lüks değil, zorunluluk. Tek sağlayıcıya bağlı olan şirketler risk altında. Bu olaylar, “internetin kırılganlığı” tartışmalarını kızıştırıyor.
Düzenleyici kurumlarının “düzenleme” ve “altyapı denetimi” yapmaları lazım.Bulut, CDN, DNS gibi servisler artık kamu hizmeti kadar kritik hale geldi.



Kaynak : 