รายงานเหตุการณ์ Cloudflare ล่มทั่วโลก — ต้นตอคือ “ความผิดพลาดระดับพื้นฐานของมนุษย์” ไม่ใช่ DDoS
Cloudflare ประสบปัญหาบริการเครือข่ายขัดข้องอย่างรุนแรงตั้งแต่เวลา 19:20 น. (เวลาฮ่องกง) ของวันที่ 18 พฤศจิกายน ส่งผลให้เว็บไซต์และบริการออนไลน์จำนวนมากทั่วโลกหยุดทำงาน โดยผู้ใช้จะพบข้อความ “Internal Server Error” พร้อมระบุว่าเป็นข้อผิดพลาดจากบริการของ Cloudflare
ล่าสุด Cloudflare ได้เผยแพร่รายงานอุบัติเหตุฉบับเต็ม ซึ่งระบุว่า
แม้ในช่วงแรกทีมงานจะ เข้าใจผิดว่าเกิดจากการโจมตีแบบ DDoS ขนาดใหญ่ แต่หลังการตรวจสอบอย่างละเอียดกลับพบว่า สาเหตุที่แท้จริงคือ “ความผิดพลาดของบุคลากรภายใน” ที่นำไปสู่เหตุล่มครั้งใหญ่ระดับโลก
เหตุการณ์เกิดขึ้นอย่างไร?
ข้อมูลระบุว่า ตั้งแต่เวลา 19:20 น. ของวันที่ 18 พฤศจิกายน 2025 เครือข่ายของ Cloudflare เริ่มมีความผิดปกติรุนแรง จนเว็บไซต์ชื่อดังอย่าง Downdetector เองก็ล่มไปด้วย
ช่วงแรก Cloudflare ตรวจพบทราฟฟิกจำนวนมากที่มีลักษณะคล้าย DDoS Attack ทำให้ทีมงานใช้เวลาตรวจสอบอยู่พักใหญ่ ก่อนจะพบว่าไม่ใช่การโจมตีหรือพฤติกรรมอันตรายใด ๆ จากภายนอกเลย
สาเหตุจริง: การตั้งค่าผิดพลาดของสิทธิ์ฐานข้อมูล
หลังการสืบสวนเชิงลึก พบว่าเครือข่ายล่มเกิดจากข้อผิดพลาดของเจ้าหน้าที่ภายใน ทำให้เกิด “การตั้งค่าการเปลี่ยนสิทธิ์ในระบบฐานข้อมูลผิดพลาด” ส่งผลให้ฐานข้อมูลทำการส่งออกข้อมูลจำนวนมากไปยัง "ไฟล์ลักษณะพฤติกรรม (Signature File)" ที่ใช้โดยระบบจัดการบอตของ Cloudflare
ผลที่ตามมาคือ
-
ไฟล์ Signature มีขนาดใหญ่ผิดปกติ
-
ไฟล์ขนาดยักษ์นี้ถูกกระจายไปยังระบบบอตของ Cloudflare ทุกจุดในเครือข่าย
-
ระบบป้องกันภัยพิบัติและกลไกจำกัดขนาดไฟล์ล้มเหลว
-
ทำให้บริการของ Cloudflare ทั้งระบบหยุดทำงาน
ไฟล์ Signature มีความสำคัญอย่างไร?
ไฟล์นี้เป็นหัวใจของระบบป้องกันการโจมตีของ Cloudflare ใช้สำหรับระบุพฤติกรรมผิดปกติและอัปเดตการป้องกันภัยคุกคามไซเบอร์ แต่ไฟล์ดังกล่าวมีการกำหนดขนาดสูงสุดไว้ หากใหญ่เกิน ระบบจะทำงานต่อไม่ได้ — และนั่นคือสิ่งที่เกิดขึ้น
การแก้ไขและเวลาการกู้คืน
หลังจากพบสาเหตุ Cloudflare ได้:
-
หยุดการแพร่กระจายไฟล์ผิดปกติ
-
แทนที่ไฟล์ดังกล่าวด้วยเวอร์ชันก่อนหน้า
-
เริ่มกู้คืนระบบทีละส่วน
เวลาโดยสรุปของเหตุการณ์:
-
22:20 น.: ทราฟฟิกหลักเริ่มกลับมาเป็นปกติ
-
บางเว็บไซต์ยังล่มต่อเนื่องเนื่องจากปริมาณโหลดพุ่งสูง
-
01:06 น. ของวันที่ 19 พฤศจิกายน: Cloudflare ประกาศว่าระบบทั้งหมดกลับมาทำงานเต็มรูปแบบ
รวมเวลาที่ล่มทั้งหมด 5 ชั่วโมง 45 นาที
เหตุการณ์ร้ายแรงที่สุดตั้งแต่ปี 2019
Cloudflareระบุว่านี่เป็นเหตุขัดข้องร้ายแรงที่สุดตั้งแต่ปี 2019 และยืนยันว่าได้เริ่มดำเนินการพัฒนาระบบที่ทนทานต่อข้อผิดพลาดมากขึ้น เพื่อป้องกันไม่ให้เหตุล่มแบบนี้เกิดขึ้นอีก
ที่มา: HKEPC



