És biztosak vagyunk benne, hogy február 28-án tudta meg a hálózatot érintő problémát, amelyben alig több mint öt óra elteltével a szolgáltatást és egyes alkalmazásokat érintette az ősz. Ebben az esetben a probléma a Amazon Web Services (AWS) S3 szolgáltatás és teljes egészében kihatott egy csomó olyan szolgáltatást, mint például az IFTT, a GIF Giphy webhely, a Trello vagy a Hootsuite sok más olyan társaság között, amelyeknek az Amazon egyszerű tárolási szolgáltatásának otthont ad.
Egyelőre az egyértelmű számunkra, hogy a probléma megoldódott, hogy az Amazon által végzett vizsgálat után a probléma oka emberi hiba volt. Néhány az Amazon S3 munkatársa karbantartási feladatokat hajtott végre a számlázási rendszeren, és néhány szervert le kellett zárni, amint azt gondolhatja, mindez elég rosszul végződött, és annyi, hogy több szervert rosszul zártak be, mint amennyire a feladat és a szükséges alrendszerek nem voltak képesek információk lekérésére, így a szolgáltatás leállt.
Ebben az értelemben, és látva a probléma nagyságát, az egyetlen dolog, amit tehettek, az az volt, hogy egyszerűen újraindították az egész rendszert, és ez nyilvánvalóan nem történik meg percek alatt, mivel sok folyamat több időt igényel a tárolt információ mennyisége miatt. Ebben az értelemben sok szervert még soha nem indítottak újra és ez tovább befolyásolta a szolgáltatás újraaktiválását.
Most kételkedünk abban, hogy ezt meg lehet-e ismételni, mert bár igaz, hogy a számlázási rendszer karbantartási feladatáért felelős mérnök helyesen tette a kézikönyvet, de tévedésből megérintett valamit, amit nem szabad okoznia. a hálózat bukása a jövőben megismétlődhet. Másrészt és a probléma után most új biztonsági opció ahol a mérnökök nem tudják letiltani a szervereket és az irányítópult egy független rendszer lesz az S3-tól, hogy megakadályozzuk ugyanezt egy hipotetikus jövőbeli karbantartási feladatban.