Los colapsos de Facebook y su familia de aplicaciones están provocando una interrupción significativa para las empresas de todo el mundo. Y algunos problemas se remontan al mismo inicio de internet
- 6 minutos de lectura'
Dudo que Mark Zuckerberg lea los comentarios que la gente deja en sus publicaciones de Facebook. Pero, si lo hiciera, le tomaría aproximadamente 145 días, sin dormir, para abrirse paso entre la avalancha de comentarios que le enviaron después de que se disculpara por el colapso de los servicios la semana pasada.
“Perdón por la interrupción de hoy”, publicó el fundador y director ejecutivo de Facebook, luego de casi seis horas de Facebook, WhatsApp e Instagram sin conexión. La compañía culpó a un trabajo de mantenimiento de rutina de la interrupción: sus ingenieros habían emitido un comando que desconectaba involuntariamente los centros de datos de Facebook de internet en general.
Alrededor de 827.000 personas respondieron a la disculpa de Zuckerberg. Los mensajes iban desde lo divertido (“Fue terrible, tuve que hablar con mi familia”, comentó un usuario italiano), hasta lo confundido: “Llevé mi teléfono al taller pensando que estaba roto”, escribió alguien de Namibia.
Y, por supuesto, los hubo muy molestos y enojados: “No puedes hacer que todo se cierre al mismo tiempo. El impacto no tiene precedentes”, publicó un empresario nigeriano. Otro de India pidió una compensación por la interrupción de su negocio. Lo que está claro ahora, si no era ya obvio, es cuán dependientes se volvieron miles de millones de personas de estos servicios, no solo para diversión, sino también para la comunicación esencial y el comercio.
Lo que también está claro es que esto está lejos de ser una situación única: los expertos sugieren que los cortes generalizados se están volviendo más frecuentes y más perturbadores. “Una de las cosas que hemos visto en los últimos años es una mayor dependencia de una pequeña cantidad de redes y empresas para entregar grandes porciones de contenido de internet”, dice Luke Deryckx, director técnico de Down Detector.
“Cuando uno de esos, o más de uno, tiene un problema, no solo los afecta a ellos, sino a cientos de miles de otros servicios”, agrega.
Facebook, por ejemplo, ahora se usa para entrar a una variedad de servicios y dispositivos diferentes, como televisores inteligentes. “Y entonces, ya sabes, tenemos este tipo de ‘cierres por nieve’ en internet que ocurren ahora”, dice Deryckx. “Algo pasa [y] todos nos miramos como diciendo ‘bueno, ¿qué vamos a hacer?’”.
Deryckx y su equipo en Down Detector supervisan los servicios web y los sitios web en busca de interrupciones. Dice que las interrupciones generalizadas que afectan a los principales servicios son cada vez más frecuentes y más graves.
“Cuando Facebook tiene un problema, crea un impacto tan grande en internet, pero también en la economía y, ya sabes ... en la sociedad. Millones, o potencialmente cientos de millones, de personas están simplemente sentadas esperando que un pequeño equipo en California arregle algo. Es un fenómeno interesante que creció en los últimos años”.
Derrumbes significativos
- Octubre de 2021: un “error de configuración” derribó Facebook, Instagram y WhatsApp durante casi 6 horas. Otros sitios como Twitter también se vieron interrumpidos debido al aumento de nuevas visitas a sus aplicaciones.
- Julio de 2021: más de 48 servicios, incluidos: Airbnb, Expedia, Home Depot, Salesforce estuvieron inactivos durante aproximadamente una hora después de un error con el sistema de nombres de dominio (DNS) en la empresa de entrega de contenido Akamai. Siguió a una interrupción similar en la empresa un mes antes.
- Junio de 2021: Amazon, Reddit, Twitch, Github, Shopify, Spotify, varios sitios de noticias estuvieron inactivos durante aproximadamente una hora después de que un cliente del proveedor de servicios de computación en la nube activara accidentalmente un error previamente desconocido.
- Diciembre de 2020: Gmail, YouTube, Google Drive y otros servicios de Google cayeron simultáneamente durante unos 90 minutos después de que la compañía dijera que encontró un “problema de cuota de almacenamiento interno”.
- Noviembre de 2020: un problema técnico con una de las instalaciones de Amazon Web Service en Virginia, EE.UU., afectó a miles de servicios en línea de terceros durante varias horas, principalmente en América del Norte.
- Marzo de 2019: Facebook, Instagram y WhatsApp cayeron o sufrieron graves interrupciones durante unas 14 horas después de un “cambio de configuración del servidor”. Algunos otros sitios, incluidos Tinder y Spotify, que usan Facebook para entrar, también se vieron afectados.
Inevitablemente, en algún punto, durante una gran interrupción de los servicios a la gente le preocupa que el colapso sea el resultado de algún tipo de ciberataque. Pero los expertos sugieren que, la mayoría de las veces, se debe a un caso más mundano de error humano, agravado, dicen, por la forma en que internet se mantiene unida con un conjunto complejo de sistemas obsoletos y complicados.
Durante la interrupción de Facebook, los expertos bromearon en Twitter, diciendo que algunos de los sospechosos habituales o las razones de los problemas de interrupción son “más antiguos que las Spice Girls” y están “diseñados en el reverso de una servilleta”.
El profesor Bill Buchanan, científico de internet, está de acuerdo con esta caracterización: “Internet no es la red distribuida a gran escala que DARPA (la Agencia de Proyectos de Investigación Avanzada de Defensa), los arquitectos originales de internet, intentaron crear, que podría resistir un impacto nuclear”. “Los protocolos que utiliza son básicamente los que se redactaron cuando nos conectamos a computadoras centrales desde terminales tontas. Una sola falla en su infraestructura central puede hacer que todo se derrumbe”.
El profesor Buchanan dice que se pueden hacer mejoras para hacer que internet sea más resistente, pero que muchos de los fundamentos de la red están aquí para quedarse para bien o para mal.
“En general, los sistemas funcionan y no se pueden ‘apagar’ ciertos protocolos de internet por un día para intentar rehacerlos”, señala. En lugar de intentar reconstruir los sistemas y la estructura de internet, el profesor Buchanan cree que debemos mejorar la forma en que lo usamos para almacenar y compartir datos, o arriesgarnos a más interrupciones masivas en el futuro.
Sostiene que internet se volvió demasiado centralizado, es decir, cuando demasiados datos provienen de una sola fuente. Esa tendencia debe revertirse con sistemas que tienen múltiples nódulos, explica, para que ninguna falla pueda detener el funcionamiento de un servicio. Hay un lado positivo aquí. Aunque las interrupciones importantes de internet afectan la vida de los usuarios y las empresas, en última instancia, también pueden ayudar a mejorar la resistencia de internet y los servicios web conectados a éste.
Por ejemplo, Forbes estima que Facebook perdió US$66 millones durante la interrupción de seis horas por la suspensión o el éxodo de los anunciantes en el sitio. Es probable que ese tipo de pérdida concentre las mentes de los altos ejecutivos en evitar que vuelva a suceder.’ “Perdieron una gran cantidad de dinero ese día, no solo en el precio de sus acciones, sino también en sus ingresos operativos”, según Deryckx.
“Y si nos fijamos en las interrupciones causadas por las redes de entrega de contenido como Fastly y Cloudflare, también perdieron una gran cantidad de clientes frente a la competencia. Entonces creo que estos operadores están haciendo todo lo posible para mantener las cosas en línea”, concluyó.