Un error de software activado por un cliente de Fastly causó la caída global de cientos de webs del martes
Fastly, la plataforma ‘nube de borde’ responsable de la caída global de cientos de páginas web este martes, ha dado más información sobre el problema y ha asegurado que fue causado por un error en el ‘software’ de la empresa de hace casi un mes que activó uno de sus clientes.
La caída, que se produjo el martes por la mañana y que duró aproximadamente una hora, hizo inaccesibles las páginas de medios de comunicación como The New York Times, The Guardian, CNN, AS o La Sexta, y de plataformas sociales como Twitch o Reddit.
En el centro de la caída está Fastly y su CDN (‘content delivery network’, o red de entrega de contenidos), una herramienta que actúa como agente de movilidad y permite el acceso a webs en todo el mundo y sin esperas mediante nodos, sin importar en qué país estén sus servidores.
Este martes por la noche, el vicepresidente sénior de Ingeniería e Infraestructura de Fastly, Nick Rockwell, ha publicado un comunicado en el que ha proporcionado más detalles sobre el problema de servicio del 8 de junio.
Rockwell explica que la compañía detectó el error en solo un minuto, y procedió a identificar la causa y deshabilitar la configuración que generó los problemas. En 49 minutos, el 95 por ciento de la red de Fastly ya funcionaba de manera normal.
Fastly ha explicado que el problema se originó en un despliegue de software que llevó a cabo la empresa en el 12 de mayo, que contenía un error que podía activarse “por una configuración de cliente específica en circunstancias específicas”.
Este martes, un cliente de Fastly llevó a cabo un cambio de configuración que, aunque la compañía asegura que fue válido, provocó el error en el código vulnerable introducido casi un mes antes. Como resultado, el 85 por ciento de la red de Fastly devolvía errores a los internautas que intentaban usar los servicios.
A las 19:25 horas de la tarde Fastly ya había lanzado una solución permanente para el problema de software, y la compañía se ha comprometido a desplegar este parche “de la manera más rápida y segura posible”, según Rockwell.
Fastly llevará a cabo también una investigación completa sobre las prácticas que llevó a cabo durante el incidente, así como para determinar por qué no detectó en sus procesos de revisión el error que ocasionó la caída global. También evaluará formas de mejorar su tiempo de solución de problemas.
Europa Press