Và chúng tôi chắc chắn rằng bạn đã phát hiện ra sự cố ảnh hưởng đến mạng vào ngày 28 tháng XNUMX, trong đó chỉ sau hơn XNUMX giờ dịch vụ và một số ứng dụng đã bị ảnh hưởng bởi mùa thu năm nay. Trong trường hợp này, vấn đề dựa trên Dịch vụ S3 của Amazon Web Services (AWS) và nó hoàn toàn ảnh hưởng đến một số dịch vụ tốt như IFTT, trang web GIF Giphy, Trello hoặc Hootsuite trong số nhiều công ty khác được lưu trữ trong Dịch vụ lưu trữ đơn giản này, từ Amazon.
Hiện tại, điều rõ ràng đối với chúng tôi khi vấn đề đã được giải quyết là sau cuộc điều tra do Amazon thực hiện, nguyên nhân của vấn đề là do lỗi của con người. Một số nhân viên của Amazon S3 đang thực hiện các nhiệm vụ bảo trì trên hệ thống thanh toán và cần phải đóng một số máy chủ, như bạn có thể đang nghĩ, tất cả điều này đã kết thúc khá tệ và có nhiều máy chủ bị đóng sai cách hơn mức cần thiết cho tác vụ và các hệ thống con cần thiết không có khả năng truy xuất thông tin, vì vậy dịch vụ ngừng hoạt động.
Theo nghĩa này, và nhìn thấy mức độ của vấn đề, điều duy nhất họ có thể làm là khởi động lại toàn bộ hệ thống và điều này rõ ràng không được thực hiện trong vài phút vì nhiều quy trình đòi hỏi nhiều thời gian hơn do lượng thông tin mà họ lưu trữ. Theo nghĩa này, ngoài điều này, nhiều máy chủ chưa bao giờ được khởi động lại trước đây và điều này càng ảnh hưởng đến việc kích hoạt lại dịch vụ.
Bây giờ chúng tôi nghi ngờ về việc liệu điều này có thể lặp lại một lần nữa hay không vì mặc dù đúng là kỹ sư phụ trách nhiệm vụ bảo trì trong hệ thống thanh toán đã làm đúng với hướng dẫn sử dụng, nhưng do nhầm lẫn anh ta đã chạm vào thứ mà anh ta không nên gây ra rớt mạng có thể xảy ra một lần nữa trong tương lai. Mặt khác và sau vấn đề bây giờ có một tùy chọn bảo mật trong đó các kỹ sư sẽ không thể hủy kích hoạt các máy chủ và bảng điều khiển sẽ là một hệ thống độc lập với S3 để ngăn điều tương tự xảy ra trong một nhiệm vụ bảo trì giả định trong tương lai.