AWS ล่มครั้งใหญ่! ครึ่งหนึ่งของอินเทอร์เน็ตทั่วโลกหยุดทำงาน — ขณะนี้บริการเริ่มทยอยกลับมาแล้ว
Amazon Web Services (AWS) ประสบปัญหาขัดข้องครั้งใหญ่ ส่งผลให้ “ครึ่งหนึ่งของอินเทอร์เน็ต” ที่พึ่งพาโครงสร้างพื้นฐานของ AWS ไม่สามารถให้บริการได้ชั่วคราว อย่างไรก็ตาม ขณะนี้หลายระบบเริ่มทยอยฟื้นตัวแล้ว
เหตุการณ์เริ่มขึ้นในช่วงเช้าวันจันทร์ตามเวลาแปซิฟิก (Pacific Daylight Time – PDT) โดย AWS รายงานว่าเกิด “อัตราความผิดพลาดและความหน่วงสูงผิดปกติ” ในหลายบริการภายใน ภูมิภาค US-EAST-1 ซึ่งเป็นศูนย์ข้อมูลหลักของบริษัท
เว็บไซต์และบริการออนไลน์ชื่อดังหลายแห่งได้รับผลกระทบพร้อมกัน ไม่ว่าจะเป็น Amazon.com, Alexa, ChatGPT, Epic Games Store, Epic Online Services, รวมถึงแพลตฟอร์มโซเชียลมีเดียอย่าง Snapchat และเกมยอดนิยม Fortnite ก็ล่มไปด้วย
ไม่กี่ชั่วโมงต่อมา AWS ยืนยันว่าได้ “จำกัดขอบเขตของปัญหา” แล้ว พร้อมระบุว่า
“เราพบสาเหตุเบื้องต้นที่อาจทำให้เกิดอัตราความผิดพลาดของ API ของ DynamoDB ในภูมิภาค US-EAST-1 และพบว่าปัญหานี้ส่งผลกระทบต่อบริการอื่น ๆ ในภูมิภาคเดียวกันด้วย”
AWS ยังเสริมว่า บริการระดับโลกบางส่วนที่อ้างอิงกับศูนย์ข้อมูล US-EAST-1 เช่น IAM updates และ DynamoDB Global Tables อาจได้รับผลกระทบไปด้วยเช่นกัน รวมถึงลูกค้าอาจไม่สามารถสร้างหรืออัปเดต “Support Cases” ได้ในช่วงนี้ พร้อมแนะนำให้ลูกค้า “ลองส่งคำขอใหม่อีกครั้ง” หากเกิดความล้มเหลวในการเชื่อมต่อ
หลังจากนั้น AWS ได้ออกแถลงเพิ่มเติมว่า
“ปัญหาที่เกิดจากระบบ DNS ได้รับการแก้ไขอย่างสมบูรณ์แล้ว และการดำเนินการของบริการส่วนใหญ่ได้กลับมาทำงานตามปกติ”
อัปเดตล่าสุด (เวลา 19:45 UTC): AWS ยังคงพบปัญหาเล็กน้อยบางส่วน แต่การฟื้นตัวโดยรวมอยู่ในระหว่างดำเนินการ โดยทีมงานระบุว่า
“เรายังคงสังเกตเห็นการฟื้นตัวของบริการทั้งหมด และสามารถเปิดใช้งานอินสแตนซ์ได้สำเร็จในหลาย Availability Zones ภายในภูมิภาค US-EAST-1”
ในระหว่างที่ AWS ดำเนินการกู้คืนระบบอย่างเต็มรูปแบบ ลูกค้าที่บริการยังไม่กลับมาเป็นปกติ แนะนำให้ทำการ ล้าง DNS cache ของระบบเพื่อช่วยให้การเชื่อมต่อกลับมาทำงานได้เร็วขึ้น
โครงสร้างพื้นฐานของพวกเขาออกแบบให้ทำงานได้โดยไม่ต้องพึ่งพาผู้ให้บริการคลาวด์รายใด เช่น AWS, Azure หรือ GCP ดังนั้นการล่มครั้งนี้ “ไม่ได้ส่งผลกระทบต่อเซิร์ฟเวอร์ของพวกเขาโดยตรง” และยังเปิดกระทู้ในฟอรั่มเพื่ออัปเดตสถานการณ์ให้ชุมชนติดตามได้แบบเรียลไทม์
ที่มา: AWS Status