Error menor, catástrofe mayor: GitLab se desconecta por un día

GitLab , una startup que es una alternativa al popular GitHub , ha tenido un día bastante difícil recientemente, ya que un error humano provocó que todo el sitio web estuviera inactivo durante un día completo .

El problema de GitLab comenzó cuando el sitio web experimentaba problemas de estabilidad y tiempo de carga . El sitio web se desconectó para corregir los problemas. Sin embargo, durante el mantenimiento, alguien cometió involuntariamente el error de eliminar accidentalmente un directorio que contenía 300 GB de datos de producción en vivo .

Afortunadamente para GitLab, los contenidos que se eliminaron solo afectaron problemas y solicitudes fusionadas . Los repositorios y wikis no se vieron afectados por este error de ninguna manera, lo que significa que el daño causado por este error no fue tan severo como podría haber sido

Con>otro> . Según el archivo de Google Doc que se actualizaba constantemente a medida que GitLab luchaba por volver a estar en línea, las 5 técnicas de copia de seguridad / replicación que implementó el sitio web no funcionaron de manera confiable y, en algunos casos, nunca se configuraron en primer lugar .

Recuperar estos archivos perdidos de la nube tampoco es una opción para GitLab, ya que la startup decidió a fines del año pasado volcar la nube para construir y operar sus propios clústeres Ceph . No hace falta decir que GitLab ahora está reconsiderando su postura sobre ese tema en particular.

A pesar del día tumultuoso que ha tenido GitLab, el sitio web ahora está funcionando como de costumbre. Si bien el sitio web informó que se perdieron algunos datos durante una ventana de seis horas , los repositorios de Git no sufrieron daños durante toda la prueba. Aquí se puede ver un registro de incidentes completo de todo el evento .

Si bien se pueden aprender muchas lecciones del pequeño error de GitLab (principalmente arrogancia), el método de GitLab para manejar la crisis es bastante admirable ya que la startup fue clara y transparente con sus usuarios . Esperamos que GitLab aprenda de este error. De lo contrario, su base de usuarios probablemente sería menos indulgente si la historia se repite.

Fuente: The Register

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *