Caos en internet: estamos viviendo caídas parciales o totales de Amazon, Spotify, Reddit, o Twitch [Actualización: ya está solucionado]

Javier Pastor

Durante cerca de una hora esta mañana acceder a Amazon, Twitch, Vimeo o Reddit (entre otras muchas)ha sido impsoible. Al intentarlo aparecíaun mensaje de error (normalmente un “503 Service Unavailable”), y el problema se ha debido a unacaída de un CDN llamado Fastly.

Esta empresa proporciona una Content Delivery Network, una infraestructura que permite acelerar el acceso a todo tipo de contenidos web. Sus responsableshan identificado el problema apenas una hora después de producirse y ya lo han corregido, lo que ha hecho que los servicios afectados estén de nuevo disponibles.

Caída brutal de múltiples servicios en internet

Los indiciosapuntaban desde el principio a la caída de Fastly, un Content Delivery Network (CDN) que permite acelerar el comportamiento de esos servicios web cacheando ciertos datos para que cuando accedemos a ellos ese acceso sea casi instantáneo.

Lapágina de información de estadode los servicios de este CDN mostraba en esos momentos cómose había producido un incidente a las 11:58 CEST. Los responsables indicaban aproximadamente una horaa después quehabían identificado el problemay que se estaba implementando la solución.

Ese incidenteha afectado a múltiples centros de datos en todo el mundo, y esa parece la causa de la caída de muchísimos servicios que hacen uso de esta plataforma de distribución de contenidos.

No importa que esos servicios estén alojados en infraestructuras como AWS o Azure:si los datos pasan por Fastly, el error se producey hace que dichos servicios estén inaccesibles.

Entre los afectados parcial o totalmentehan estado la propia Amazon, Spotify, Twitch, Vimeo, Reddit, Shopify, Giphy, Quora, o Metacritic, pero también medios de comunicación como The New York Times, la CNN, El Mundo, The Verge, Financial Times, The Guardian o Vice. Otros sitios como GitHub han estado accesibles, pero sin mostrar apenas contenido.

Al intentar acceder a todos ellos aparecía normalmenteun mensaje de error “503 Service Unavailable"o bien un simple “connection failure”.

El servicio Downdetector que registra caídas de todo tipo de plataformas web mostraba durante esos momentos unaumento de incidencias en múltiples servicios como los citados, y todas ellas parecen estar extendidas por todo el mundo y no localizadas en un punto concreto.

Aunque los indicios apuntaban inicialmente a Amazon Web Services (AWS), la plataforma en la nube de Amazon, lapágina de información de sus servidoresmostraba que todos estaban funcionando normalmente.

Desde Xataka nos pusimos en contacto con Amazon, cuyos portavoces nos indicaron que “ahora mismo no tenemos ningún comentarioque hacer sobre este tema”, y añaden que “si hubiese alguna actualización” nos informarán sin falta.

Como indicábamos inicialmente, el problema se corrigió apenas una hora después de descubrirse, ytodos los servicios que habían estado inaccesibles ya vuelven a estar operativos.

En Fastly indican que en estos primeros accesos a esos servicios “se podría experimentar un tiempo de carga mayor” en estos primeros momentos a medida que los servicios están volviendo a funcionar, pero más allá de eso, todo ha vuelto a la normalidad.

Según los responsables de Fastlyse ha identificado"una configuración del servicio que ha provocadodisrupciones en nuestros POPs(Points of Presence) de forma global, y hemos procedido a deshabilitar dicha configuración”. Los datos revelan que la incidencia se produjo a las 09:47 UTC y se comenzó la corrección del problema a las 10:36 UTC, con el 50% restaurado a las 11:00 UTC.