และเรามั่นใจว่าคุณพบปัญหาที่ส่งผลกระทบต่อเครือข่ายเมื่อวันที่ 28 กุมภาพันธ์ซึ่งหลังจากนั้นเพียงห้าชั่วโมงบริการและแอปพลิเคชันบางตัวก็ได้รับผลกระทบจากฤดูใบไม้ร่วงนี้ ในกรณีนี้ปัญหาจะขึ้นอยู่กับไฟล์ บริการ Amazon Web Services (AWS) S3 และส่งผลกระทบอย่างเต็มที่ต่อบริการจำนวนหนึ่งเช่น IFTT, เว็บไซต์ GIF Giphy, Trello หรือ Hootsuite ท่ามกลาง บริษัท อื่น ๆ อีกมากมายที่โฮสต์ใน Simple Storage Service นี้จาก Amazon
สำหรับตอนนี้สิ่งที่ชัดเจนสำหรับเราเมื่อปัญหาได้รับการแก้ไขแล้วคือหลังจากการตรวจสอบโดย Amazon สาเหตุของปัญหาเกิดจากความผิดพลาดของมนุษย์ พนักงานของ Amazon S3 บางคนกำลังดำเนินการบำรุงรักษาในระบบการเรียกเก็บเงินและจำเป็นต้องปิดเซิร์ฟเวอร์บางตัวอย่างที่คุณคิดว่าทั้งหมดนี้จบลงค่อนข้างแย่และเซิร์ฟเวอร์จำนวนมากถูกปิดด้วยวิธีที่ไม่ถูกต้องเกินความจำเป็นสำหรับงานและ ระบบย่อยที่จำเป็นไม่สามารถดึงข้อมูลได้ ดังนั้นบริการจึงหยุดทำงาน.
ในแง่นี้และเห็นขนาดของปัญหาสิ่งเดียวที่พวกเขาทำได้คือเพียงแค่รีสตาร์ทระบบทั้งหมดและเห็นได้ชัดว่าสิ่งนี้จะไม่เสร็จสิ้นภายในไม่กี่นาทีเนื่องจากกระบวนการหลายอย่างต้องใช้เวลามากขึ้นเนื่องจากจำนวนข้อมูลที่จัดเก็บ ในแง่นี้นอกจากนี้ เซิร์ฟเวอร์จำนวนมากไม่เคยรีบูตมาก่อน และส่งผลต่อการเปิดใช้บริการอีกครั้ง
ตอนนี้เรามีข้อสงสัยว่าจะสามารถทำซ้ำได้อีกหรือไม่เนื่องจากแม้ว่าจะเป็นความจริงที่ว่าวิศวกรที่รับผิดชอบงานบำรุงรักษาในระบบการเรียกเก็บเงินได้ดำเนินการในสิ่งที่ถูกต้องเกี่ยวกับคู่มือ แต่ด้วยความผิดพลาดเขาได้สัมผัสกับสิ่งที่เขาไม่ควรทำให้เกิด การล่มสลายของเครือข่ายอาจเกิดขึ้นได้อีกในอนาคต ในขณะที่ปัญหาอื่น ๆ และหลังจากนี้มีใหม่ ตัวเลือกความปลอดภัย โดยที่วิศวกรจะไม่สามารถปิดใช้งานเซิร์ฟเวอร์ได้ และแดชบอร์ดจะเป็นระบบอิสระจาก S3 เพื่อป้องกันไม่ให้สิ่งเดียวกันนี้เกิดขึ้นในงานบำรุงรักษาในอนาคตที่สมมุติขึ้น