Seis horas, el peor accidente de Facebook: por qué se ha caído WhatsApp
El corte de servicios ha roto casi todos los sistemas internos que los empleados de Facebook usan para trabajar.
Casi 6 horas. Seis. Eso es lo que han estado caídos los servicios de tres de las redes, apps y plataformas sociales y de comunicación online más usadas: WhatsApp, Instagram y Facebook -dueña además de los dos primeros. Seis horas de puro pánico no sólo entre los miles de millones de usuarios/as -que componen en caso de WhatsApp 1/4 del total de la población mundial, y en caso de Facebook más aún-, sino entre todos los empleados del gigante de Internet.
El accidente más grave en años
La interrupción comenzó justo a las 17:30 hora española, y tardó casi seis horas en resolverse. De hecho sus efectos aún resuenan. Este es el peor apagón para Facebook, el peor corte de actividad desde que un incidente de 2019 dejó su sitio fuera de servicio durante más de 24 horas, ya que el tiempo de inactividad afectó más a las pequeñas empresas y creadores que dependen de estos servicios para sus ingresos.
En Twitter, el ejecutivo de comunicaciones de Facebook Andy Stone señalaba en su Twitter que "Somos conscientes de que algunas personas están teniendo problemas para acceder a nuestras aplicaciones y productos. Estamos trabajando para que las cosas vuelvan a la normalidad lo antes posible, y nos disculpamos por las molestias." Mike Schroepfer, que dejará su puesto de CTO el próximo año, tuiteó: "Estamos experimentando problemas de red y los equipos están trabajando lo más rápido posible para depurar y restaurar lo más rápido posible”.
Pánico en Facebook
Según leemos en el medio The Verge, al que varios empleados de la compañía le han contado la situación vivida en las últimas horas, dentro de Facebook, el corte en el servicio “ha roto casi todos los sistemas internos que los empleados utilizan para comunicarse y trabajar”. Varios empleados recurrieron a “hablar a través de sus cuentas de correo electrónico de Outlook proporcionadas por el trabajo. Aunque los empleados "no pueden recibir correos electrónicos de direcciones externas”.
Los empleados que estaban conectados a herramientas de trabajo como Google Docs y Zoom antes de la interrupción "han podido seguir utilizándolas", pero cualquier empleado que necesitara conectarse con su correo electrónico de trabajo "fue bloqueado".
Los ingenieros de Facebook incluso fueron “enviados a los centros de datos de la compañía en Estados Unidos para intentar solucionar el problema", según dos personas familiarizadas con la situación. Eso significa que la interrupción, que ya es la más grave de Facebook en años, podría “prolongarse aún más”, ya que significa que la solución no podía hacerse de forma remota.
Para complicar aún más las cosas, la interrupción cortó el acceso de algunos empleados a los edificios de la empresa y a las salas de conferencias con sus tarjetas de identificación, según The New York Times, que fue el primero en informar de que se estaban enviando ingenieros al centro de datos.
Un problema con las DNS
Un vistazo a Down Detector revelaba que los problemas eran generalizados. Si bien no está claro exactamente por qué las plataformas eran inalcanzables para tantas personas, sus registros DNS muestran que, al igual que la interrupción de Slack de la semana pasada, "el problema es aparentemente DNS".
Instagram.com mostraba un mensaje de error de servidor 5xx, mientras que el sitio de Facebook se limitaba a decir que algo iba mal. El problema también afectó a la división de realidad virtual, Oculus: Los usuarios podían cargar los juegos que ya tenían instalados y el navegador funcionaba, pero las funciones sociales o la instalación de nuevos juegos no.
No ha sido un hackeo… ¿O sí?
El Border Gateway Protocol (BGP) es el protocolo de enrutamiento de Internet, encargado de procesar y elegir las rutas más eficientes para entregar el tráfico de Internet. El vicepresidente senior de Cloudflare, Dane Knecht, señaló públicamente en Twitter -la red más activa durante el apagón al no haber estado afectada- que estas rutas del BGP fueron repentinamente "retiradas de Internet".
Aunque algunos han especulado con la posibilidad de que se trate de hackers o de una protesta interna por el informe de anoche, todavía no hay ninguna información que sugiera que la culpa del histórico ‘apagón’ haya sido provocada.
La declaración oficial de Facebook
"A la enorme comunidad de personas y empresas de todo el mundo que dependen de nosotros: lo sentimos. Hemos trabajado duro para restablecer el acceso a nuestras aplicaciones y servicios, y nos complace informarles de que ya vuelven a estar en línea. Gracias por tener paciencia".
Facebook culpó a un "cambio de configuración defectuoso" del problema en sus servicios. "Nuestros equipos de ingeniería se han enterado de que los cambios de configuración en los routers troncales que coordinan el tráfico de red entre nuestros centros de datos causaron problemas que interrumpieron esta comunicación. Esta interrupción del tráfico de red tuvo un efecto en cascada en la forma en que se comunican nuestros centros de datos, lo que provocó la interrupción de nuestros servicios.
Queremos dejar claro en este momento que creemos que la causa principal de esta interrupción fue un cambio de configuración defectuoso. Tampoco tenemos pruebas de que los datos de los usuarios se hayan visto comprometidos como resultado de esta interrupción".
El precio de las acciones de Facebook se desplomó un 4,9% en medio de la interrupción ayer del servicio, que también se produjo el día después de que un denunciante afirmara en una entrevista en Estados Unidos que la empresa da prioridad a sus propios intereses sobre el bien público.