Ja oleme kindlad, et saite 28. veebruaril võrku mõjutanud probleemist teada, kus veidi üle viie tunni pärast mõjutas see sügis teenust ja mõnda rakendust. Sel juhul põhineb probleem Amazoni veebiteenuste (AWS) S3 teenus ja see mõjutas täielikult paljusid teenuseid, nagu IFTT, GIF Giphy veebisait, Trello või Hootsuite paljude teiste Amazonist selles lihtsas salvestusteenuses pakutavate ettevõtete hulgas.
Praegu on meile pärast probleemi lahendamist selge, et pärast Amazoni läbi viidud uurimist on probleemi põhjuseks olnud inimlik eksitus. Mõned Amazon S3 töötajad tegid arveldussüsteemis hooldustoiminguid ja oli vaja sulgeda mõned serverid, nagu te arvate, kõik see lõppes üsna halvasti ja see, et rohkem servereid suleti valel viisil, kui ülesande jaoks vajalik oli vajalik allsüsteemid ei olnud võimelised teavet hankima, nii et teenus lakkas töötamast.
Selles mõttes ja probleemi suurust nähes oli ainus asi, mida nad teha said, lihtsalt kogu süsteemi taaskäivitada ja seda ei tehta ilmselgelt minutitega, kuna paljud protsessid nõuavad nende salvestatud teabe hulga tõttu rohkem aega. Selles mõttes lisaks sellele paljusid servereid polnud kunagi varem taaskäivitatud ja see mõjutas veelgi teenuse taasaktiveerimist.
Nüüd on meil kahtlus, kas seda saab uuesti korrata, sest kuigi on tõsi, et arveldussüsteemi hooldustööde eest vastutav insener tegi käsiraamatuga õigesti, kuid ekslikult puudutas ta midagi, mida ta ei tohiks põhjustada Võrgu kukkumine võib tulevikus korduda. Teiselt poolt ja pärast probleemi on nüüd uus turvavõimalus kus insenerid ei saa servereid keelata armatuurlaud on S3-st sõltumatu süsteem, et vältida sama juhtumist hüpoteetilises tulevases hooldustoimingus.