Por Luis Eduardo Vázquez, director de Ingeniería y Centro de Soluciones para Vertiv México
Las fallas inesperadas en el centro de datos suponen graves riesgos para una infraestructura crítica y ponen en riesgo la continuidad de los negocios. Estas interrupciones pueden ser causadas, ya sea por una interrupción a gran escala o un desperfecto técnico localizado.
El mal funcionamiento de un equipo en la infraestructura, la falta de comunicación entre el centro de datos con los sitios externos al mismo, así como errores en el procesamiento de datos, están entre las variables que pueden resultar en la falla de un centro de datos. En otros casos, puede haber una buena comunicación u operación adecuada del equipo de soporte del centro de datos, pero cuando la capacidad de procesamiento de datos no es la óptima, aún es probable que haya una pérdida de información.
Un estudio encargado por Vertiv sobre los costos de interrupción, muestra que cada minuto de inactividad en los servidores puede costar hasta US$9.000, y los mayores problemas están relacionados con la pérdida del costo de oportunidad. La interrupción de los negocios, combinado con la pérdida de ingresos, representa más del 60% del costo total de un apagón de esta magnitud.
Por ello, es fundamental contar con una respuesta rápida y oportuna durante emergencias, para garantizar que un centro de datos restablezca las operaciones de su infraestructura de manera rápida, segura y confiable. En ese sentido, Vertiv destaca cuatro prácticas que permiten evitar un tiempo de inactividad:
- Garantizar un mantenimiento adecuado y programado. Tan importante como el diseño del centro de datos en sí mismo, son los equipos que se utilizan, los cuales deben recibir mantenimiento continuo y programado, ya sean aires acondicionados, unidades UPS o generadores. Con el mantenimiento regular, se puede saber lo que está pasando dentro del centro de datos y prevenir una posible falla. La importancia del mantenimiento es que sea preventivo y no reactivo.
- Capacitar al personal. El error humano también es una causa principal del tiempo de inactividad del centro de datos. La capacitación del personal debe ser una prioridad para garantizar que un centro de datos funcione sin ningún problema.
- Tener una infraestructura unificada. Al contar con una menor cantidad de proveedores instalados en el centro de datos, la falla de un dispositivo será más fácil de resolver, ya que puede estandarizar sus repuestos y agilizar el proceso para llevar la parte adecuada a su sitio. La idea es simplificar la infraestructura para una respuesta y solución más efectiva.
- Conceptualizar el centro de datos. Al diseñar, construir o actualizar un centro de datos, se debe instalar equipos con la mejor tecnología y la más alta confiabilidad. Al utilizar la infraestructura inteligente como parte de los sistemas de alimentación y refrigeración de aire acondicionados, se puede obtener la visibilidad y el control necesario para garantizar la continuidad digital de los centros de datos.
Contar con una infraestructura de alta disponibilidad, con equipos de alta confiabilidad, junto a un personal que conozca al detalle cómo operar el centro de datos y que además tenga una cultura preventiva y proactiva, hará posible que un centro de datos funcione correctamente.