Passava pouco das 8h em Londres quando os sites do governo britânico começaram a piscar e desaparecer.
A maior parte da América estava dormindo, mas alguns notívagos da Costa Leste encontraram sua barraca no serviço de streaming da Disney.
As pessoas que pediam carona para casa depois de uma festa de domingo à noite estavam com dificuldades. As atividades rotineiras foram paralisadas.
À medida que o leste dos Estados Unidos despertava, a escala do problema tornou-se evidente.
A United Airlines e a Delta descobriram que seus passageiros não conseguiam usar os serviços online. Os passageiros acostumados a ler o boletim matinal do New York Times ficaram sem. Os Snapchatters ficaram em silêncio; Os fóruns do Reddit ficaram em silêncio.
De acordo com a Deepfield Networks, um terço de todos os usuários online em todo o mundo interage com a Amazon Web Services (AWS) todos os dias: empresas como Venmo, Reddit e Ring dependem de servidores AWS. E, na manhã de segunda-feira, o sistema caiu – uma parte significativa da Internet caiu.
O especialista em segurança cibernética James Knight disse que era “incrível” que tal interrupção pudesse acontecer. Guerra digitalque ajuda as empresas a identificar e remediar vulnerabilidades online. É um indicador perturbador de um novo tipo de caos do qual nenhum de nós está imune.
Knight disse ao Daily Mail: “Meu primeiro pensamento foi como isso poderia acontecer. Aparentemente, o banco de dados caiu de alguma forma.
De acordo com a Deepfield Networks, um terço de todos os usuários online em todo o mundo interage com a Amazon Web Services (AWS) todos os dias: empresas como Venmo, Reddit e Ring dependem de servidores AWS. E, na manhã de segunda-feira, o sistema caiu
“É surpreendente que algo tenha afetado a rede deles, porque normalmente há backups e sistemas redundantes em execução ao mesmo tempo. O colapso de um sistema específico é muito, muito surpreendente”.
Knight admitiu que ficou surpreso com a interrupção, que, segundo ele, custará milhões de dólares à Amazon.
Tudo começou às 3h11 ET. O problema foi identificado às 5h01 ET e uma ‘correção’ foi implantada em 20 minutos.
No entanto, o problema permanece sem solução e, às 8h48 ET, a Amazon divulgou outra atualização dizendo que mais correções estão em andamento.
O espectro de um ataque cibernético foi inevitavelmente levantado, mas, segundo Knight, é improvável.
Ele explicou: “Um profissional cibernético como eu, ou qualquer pessoa que esteja olhando para isso, poderá ver se é um hack. Isto é chamado de indicação de compromisso, um COI.
‘Provavelmente queremos ver uma assinatura de malware; certos tipos de acesso não autorizado; Algo nos logs que mostra que há algum tipo de acesso ou algum tráfego incomum. Não há nada que implique isso aqui.
Ele também disse que a Amazon é legalmente obrigada a divulgar qualquer hack.
Em vez disso, a empresa disse que o problema se originou em suas instalações na Virgínia, conhecida como região US-EAST-1.
A última grande interrupção ocorreu em 2021 – um sinal, disse Knight, da verdadeira resiliência dos sistemas da AWS. Mas os problemas, quando ocorrem, podem ser devastadores.
Em julho de 2024, a empresa de segurança cibernética Crowdstrike fechou por vários dias, causando a maior interrupção de TI da história.
A falha em si durou apenas 90 minutos, mas algumas empresas levaram dias para se recuperar. Uma seguradora calculou que a questão custou, só às empresas Fortune 500, mais de 5 mil milhões de dólares em perdas diretas, sendo as companhias aéreas e os hospitais os que mais sofreram.
A empresa de telecomunicações AT&T encontrou sua rede indisponível várias vezes no ano passado, principalmente durante uma interrupção de 11 horas em fevereiro.
Knight disse que é um sinal dos tempos e algo com o qual simplesmente precisamos aprender a conviver.

Imagem: Um data center da Amazon Web Services na Virgínia

Imagem: Relatórios do Downdetector sobre interrupções da AWS aumentaram

Knight disse que é um sinal dos tempos e algo com o qual simplesmente precisamos aprender a conviver
“Nossas vidas estão online e isso vai acontecer”, disse ele. ‘A AWS, junto com Google e Microsoft, é o padrão ouro em computação em nuvem. Portanto, não é como se os rivais da AWS fossem presunçosos, porque isso poderia acontecer com eles amanhã.
‘Eu realmente não posso criticar a AWS. Eles respondem muito bem. Não sei se alguém vai ficar com a cabeça girando, mas isso será levado muito a sério e acho que eles vão aproveitar as lições aprendidas para que possam melhorar.’
Dado o espaço de computação em nuvem extremamente competitivo, no entanto, a AWS não compartilhará suas soluções com seus rivais.
Isso significa que as empresas hoje têm muitos ovos na mesma cesta? Eles deveriam distribuir seus serviços usando várias empresas de computação em nuvem?
Knight disse que sim, em teoria, mas seria difícil de administrar e não necessariamente útil.
‘A AWS já está dividida em várias cestas, e é por isso que as pessoas mantêm as coisas na nuvem’, disse ele. ‘Alguns de seus servidores estão em um lugar na nuvem e alguns em outro: alguns na costa leste dos EUA, alguns na costa oeste, alguns na Ásia e estão espalhados por aí.’
A partir das 11h43 ET de segunda-feira, mais de oito horas após os primeiros sinais de problemas, a Amazon disse com otimismo que o fim estava próximo.
“Restringimos a origem dos problemas de conectividade de rede que afetaram os serviços da AWS”, disse a empresa. ‘A causa raiz é um subsistema interno subjacente responsável por monitorar a integridade de nossos balanceadores de carga de rede.’
Afirmaram que estavam a abrandar deliberadamente alguns serviços “para ajudar na recuperação” e que ainda estavam “a trabalhar activamente na mitigação”.
Knight disse que a Amazon estudará detalhadamente o que deu errado e aprenderá com a interrupção.
“Eles vão determinar a causa raiz”, disse ele. ‘E então eles vão melhorar seus métodos.’
Eles “serão mais fortes”, disse ele, e farão o que puderem para garantir que isso não aconteça novamente. Mas a verdade é que todos temos que conviver com isso. E da próxima vez pode ser pior.