Mes esame tikri, kad apie problemą, kuri paveikė tinklą, sužinojote vasario 28 d., Kai po kiek daugiau nei penkių valandų tarnyba ir kai kurios programos nukentėjo nuo šio rudens. Šiuo atveju problema grindžiama „Amazon Web Services“ (AWS) S3 paslauga ir tai visiškai paveikė daugybę paslaugų, tokių kaip IFTT, „GIF Giphy“ svetainė, „Trello“ ar „Hootsuite“ tarp daugelio kitų kompanijų, kurios yra prižiūrimos šioje „Simple Storage Service“, iš „Amazon“.
Kol kas mums aišku, kai tik problema bus išspręsta, yra tai, kad po „Amazon“ atlikto tyrimo problemos priežastis buvo žmogaus klaida. Kai kurie „Amazon S3“ darbuotojai vykdė atsiskaitymo sistemos priežiūros užduotis ir reikėjo uždaryti kai kuriuos serverius, kaip jūs manote, visa tai baigėsi gana blogai ir tai, kad daugiau serverių buvo uždaryta netinkamu būdu, nei reikia užduočiai atlikti ir būtini posistemiai negalėjo gauti informacijos, taigi tarnyba nustojo veikti.
Šia prasme ir matant problemos mastą, vienintelis dalykas, kurį jie galėjo padaryti, buvo tiesiog paleisti visą sistemą iš naujo, ir tai akivaizdžiai nėra padaryta per kelias minutes, nes daugeliui procesų reikia daugiau laiko dėl jų saugomos informacijos kiekio. Šia prasme, be to, daugelis serverių dar niekada nebuvo perkrauti ir tai dar labiau paveikė tarnybos atnaujinimą.
Dabar mums kyla abejonių, ar tai galima pakartoti dar kartą, nes nors tiesa, kad inžinierius, atsakingas už atsiskaitymo sistemos techninę priežiūrą, padarė teisingą vadovą, tačiau per klaidą palietė tai, ko neturėtų sukelti tinklo griūtis gali pasikartoti ateityje. Kita vertus, ir po problemos dabar yra nauja saugumo galimybė kurioje inžinieriai negalės išjungti serverių ir prietaisų skydelis bus nepriklausoma sistema nuo S3, kad būtų išvengta to paties įvykimo atliekant hipotetinę būsimą priežiūros užduotį.