Sigurni smo da ste za problem koji je utjecao na mrežu saznali 28. veljače u kojem je nakon nešto više od pet sati na uslugu i neke programe utjecala ova jesen. U ovom se slučaju problem temelji na Usluga Amazon Web Services (AWS) S3 i to je u potpunosti utjecalo na dobar broj usluga kao što su IFTT, web mjesto GIF Giphy, Trello ili Hootsuite, među mnogim drugim tvrtkama koje su domaćini u ovoj Jednostavnoj usluzi za pohranu, od Amazona.
Za sada je ono što smo jasno otkrili nakon što je problem riješen jest da je nakon istrage koju je proveo Amazon uzrok problema bila ljudska pogreška. Neki su radnici Amazona S3 obavljali zadatke održavanja na naplatnom sustavu i bilo je potrebno zatvoriti neke poslužitelje, kao što možda mislite, sve je to završilo prilično loše, a to je da je više poslužitelja zatvoreno na pogrešan način nego što je potrebno za zadatak i potrebni podsustavi nisu bili u mogućnosti pristupiti informacijama, pa je služba prestala raditi.
U tom smislu, i videći veličinu problema, jedino što su mogli učiniti bilo je jednostavno ponovno pokrenuti cijeli sustav, a to se očito ne radi za nekoliko minuta, jer mnogi procesi zahtijevaju više vremena zbog količine podataka koje pohranjuju. U ovom smislu, uz ovo, mnogi poslužitelji nikada prije nisu bili ponovno pokrenuti a to je dodatno utjecalo na reaktivaciju usluge.
Sad sumnjamo može li se to ponoviti, iako je istina da je inženjer zadužen za zadatak održavanja u sustavu naplate ispravno postupio s priručnikom, ali je zabunom dodirnuo nešto što ne bi smio uzrokovati pad mreže mogao bi se ponoviti u budućnosti. S druge strane i nakon problema sada postoji novi sigurnosna opcija u kojem inženjeri neće moći deaktivirati poslužitelje a nadzorna ploča bit će neovisni sustav od S3 kako bi se spriječilo da se isto dogodi u hipotetskom budućem zadatku održavanja.