AWS se cayó y el mundo tembló

enter image description here

Se cumplen 24 horas de la caída que ayer lunes afectó a Amazon Web Services (AWS) y específicamente a su región de North Virginia (us-east-1). A continuación, las claves de lo que ocurrió y su relevancia 👇🏻

💥 ¿Qué pasó?

Alrededor de las 9:00 de la mañana (hora española), AWS comenzó a detectar un aumento de errores en la región de North Virginia.

La causa inicial fue un fallo en la resolución DNS de los endpoints de DynamoDB, aunque más tarde se confirmó que el origen estaba en un subsistema interno de red encargado de monitorizar la salud de los balanceadores de carga.

Ese subsistema falló, afectando al routing del tráfico y provocando fallos en cascada en más de 80 servicios de AWS. AWS descartó el ciberataque.

🌍 ¿A quién afectó?

La afectación fue global. Incluso la propia Amazon (Alexa, Prime Video…) se vio impactada, junto a servicios como Snapchat, Reddit, Signal, Venmo (Paypal), Atlassian (JIRA, Trello), Duolingo —que seguía caída anoche— y plataformas de entretenimiento como Fortnite o los juegos de Supercell (Clash Royale, Clash of Clans…).

EEUU fue el más afectado, ya que gran parte de los servicios residen físicamente en us-east-1, pero la criticidad de esta región hizo que el impacto se extendiera por todo el globo.

🇪🇸 ¿Cómo afectó en España?

Servicios como Atlassian, Snapchat, Canva o Salesforce sufrieron interrupciones.

Ticketmaster cayó, generando el caos en la venta de entradas de artistas como Aitana o La Oreja de Van Gogh, que incluso pospuso la venta.

También hubo incidencias en las grandes telecos (Movistar, Orange, Vodafone) y en la banca, con interrupciones en Santander, BBVA, ING y Caixabank. Bizum y las pasarelas de pago dejaron de funcionar, afectando al uso de datáfonos en todo el país.

🏛️ ¿Por qué us-east-1?

North Virginia es la madre de todas las regiones de AWS.

Fue la primera región que desplegó Amazon y además actúa como región “global”, es decir, soporta servicios de referencia para el resto de regiones.

Tiene 6 zonas de disponibilidad (AZ), cada una un datacenter independiente, pero ya lo dice Murphy...si algo puede salir mal, saldrá mal.

Si se cae cualquier otra región (Irlanda, España...) el impacto es localizado y controlable. Cuando cae us-east-1, el tercio de internet que se estima que depende de AWS, tiembla.

El mundo ya ha recuperado la normalidad, pero esta caída - probablemente la más grave en la historia de AWS - nos recuerda la dependencia masiva que tenemos de los macrodatacenters de unas pocas compañías tecnológicas.

Y es que lo que llamamos “Cloud” no dejan de ser los cientos de miles de CPDs que teníamos repartidos por el mundo unificados en menos de un centenar de macrodatacenters.

Las ventajas del Cloud son muchas. Pero no podemos olvidar, que cuando todos estamos bajo la misma nube…si llueve, nos mojamos todos.

Y ¿a ti?¿Te afectó la caída de AWS? Te leo!