Sigurni smo da ste za problem koji je utjecao na mrežu saznali 28. februara, u kojem je nakon nešto više od pet sati na uslugu i neke aplikacije utjecala ova jesen. U ovom slučaju problem se temelji na Usluga Amazon Web Services (AWS) S3 i to je u potpunosti utjecalo na dobar broj usluga kao što su IFTT, web lokacija GIF Giphy, Trello ili Hootsuite, među mnogim drugim kompanijama koje su hostirane u ovoj Jednostavnoj usluzi skladištenja, od Amazona.
Za sada, ono što smo jasno otkrili nakon što je problem riješen je da je nakon istrage koju je provela Amazon, uzrok problema bila ljudska greška. Neki radnici Amazona S3 obavljali su zadatke održavanja na naplatnom sistemu i bilo je potrebno zatvoriti neke servere, kao što možda mislite, sve je to završilo prilično loše i to je da je više servera zatvoreno na pogrešan način nego što je potrebno za zadatak potrebnih podsistemi nisu bili u mogućnosti da preuzmu informacije, pa je služba prestala raditi.
U tom smislu, i videći veličinu problema, jedino što su mogli učiniti bilo je jednostavno ponovno pokrenuti čitav sistem, a to se očito ne radi za nekoliko minuta, jer mnogi procesi zahtijevaju više vremena zbog količine informacija koje pohranjuju. U ovom smislu pored ovog, mnogi serveri nikada prije nisu bili ponovo pokrenuti a to je dodatno utjecalo na reaktivaciju usluge.
Sad sumnjamo da li se to može ponoviti, jer iako je istina da je inženjer zadužen za zadatak održavanja u obračunskom sustavu ispravno postupio u vezi s priručnikom, ali je greškom dodirnuo nešto što ne bi trebao uzrokovati pad mreže mogao bi se ponoviti u budućnosti. S druge strane i nakon problema sada postoji novi sigurnosna opcija u kojem inženjeri neće moći deaktivirati servere a nadzorna ploča će biti nezavisni sistem od S3 kako bi se spriječilo da se isto dogodi u hipotetskom budućem zadatku održavanja.