Cómo garantizar la redundancia en alimentación y refrigeración de sistemas Edge
¿Cuánta redundancia es suficiente para un sistema Edge? Según una encuesta de 2020 realizada por Information Technology Intelligence Consulting, una sola hora de inactividad del sistema de TI podría costarle a tu empresa 300 000 USD o más. Y eso es solo el principio.
Se trata de una estimación abrumadora y que refuerza la importancia crítica de los sistemas redundantes en los centros de datos pequeños y grandes. Los fallos del sistema pueden derivar en consecuencias graves para cualquier negocio, incluida la pérdida de productividad, de ingresos y de oportunidades, y el deterioro de la reputación.
Ahora, traslada tus procesos y aplicaciones al Edge para una planta de fabricación, un centro de distribución principal, un sistema de tránsito y la red de distribución de corriente... a continuación, calcula el impacto de los costes de un fallo en el Edge si uno de estos sitios se apagara. Las pérdidas pueden incrementarse drásticamente si no se dispone de una planificación adecuada.
Para evitar el tiempo de inactividad, las empresas prevén redundancias que ayuden a garantizar que el sistema esté siempre en marcha, con un suministro eléctrico listo (y, a veces, equipos) en caso de un corte eléctrico. La redundancia también ayuda a los administradores de instalaciones y de TI a programar el mantenimiento; sin ella, sería necesario apagar un sistema para realizar el servicio.
Cuestiones de redundancia en sistemas Edge
El primer paso en la planificación de la redundancia en un sistema Edge es identificar la designación de la redundancia adecuada para la instalación. Las implementaciones de TI, independientemente del tamaño o la ubicación, se basan en un sistema común para describir el grado de redundancia incorporado en sus sistemas de alimentación y refrigeración.
- N: «N» hace referencia a la infraestructura de alimentación y refrigeración del sistema; es la capacidad de referencia sin redundancias.
- N+1: es la capacidad de referencia más un componente adicional para tener en cuenta los fallos o el mantenimiento. Los estándares de redundancia N+1 del centro de datos generalmente requieren una unidad adicional por cada cuatro necesarias, por lo que si se necesitan ocho unidades de refrigeración, una instalación N+1 tendría 10. Esta designación se adopta habitualmente en los sistemas de refrigeración de los centros de datos de EE. UU.
- 2N: se trata de un sistema completamente redundante con un sistema duplicado totalmente independiente que puede asumir todas las operaciones del sistema en caso de que el primer sistema se desconecte.
- 2N+1: un sistema de apoyo completamente en paralelo, además de los componentes adicionales, para tener en cuenta los fallos y el mantenimiento en cada sistema sin necesidad de cambiar a un sistema de reserva.
Al elegir el nivel de redundancia adecuado para sus necesidades, los administradores de instalaciones deben evaluar una serie de factores, uno de los cuales es la industria o los procesos a los que se presta servicio. Algunas implementaciones, como las de Edge, se encuentran en entornos hostiles o no controlados, lo que representa más amenazas para el tiempo de actividad que las que aparecen en un centro de datos típico. En los entornos de fabricación, por ejemplo, el polvo, los residuos, los líquidos y los disolventes, así como las subidas de tensión y otros incidentes, pueden provocar fallos en el equipo. Otros sectores, como la atención sanitaria y el gobierno, requieren el porcentaje máximo de tiempo de actividad para ofrecer unos niveles de servicio continuos a los usuarios y cumplir con las regulaciones gubernamentales o del sector.
Otro factor a tener en cuenta es el coste. Si bien es importante maximizar el tiempo de actividad adecuado para tu sector, también es aconsejable no pagar de más por capacidades que no necesitas, por lo que identificar el nivel más práctico de redundancia también es una decisión financiera.
Redundancias críticas en sistemas Edge
Muchas empresas están cambiando el centro de datos empresarial por el Edge para aprovechar su baja latencia, reducir costes y obtener otras ventajas, y los planes de redundancia diseñados para estas situaciones son importantes por dos razones:
- En primer lugar, estas implementaciones no siempre cuentan con profesionales de TI que puedan responder fácilmente a incidentes como cortes eléctricos
- En segundo lugar, muchas implementaciones de Edge se encuentran en zonas remotas o no administradas, donde los riesgos para el tiempo de actividad son incluso mayores que en un centro de datos más convencional.
Las fuentes de alimentación y los sistemas SAI son los que más afectan al tiempo de actividad, por lo que las redundancias son más críticas en estos aspectos:
- Fuentes de alimentación
Para tus servidores más críticos, se deben implementar fuentes de alimentación redundantes, procedentes de cuadros eléctricos independientes, de modo que si una fuente falla, los servidores seguirán funcionando. En condiciones normales de funcionamiento, cada una de las dos fuentes de alimentación proporcionará la mitad de la potencia necesaria. Si por algún motivo una de ellas se apaga, la otra lo compensará de inmediato para suministrar toda la energía al dispositivo para que no haya tiempos de inactividad.
Otra ventaja de la alimentación redundante es que si una deja de funcionar, se puede sustituir sin desconectar el dispositivo al que está conectada. Simplemente, puedes desconectar y quitar la fuente de alimentación defectuosa del dispositivo, colocar una nueva en su lugar y enchufarla. Tu segunda fuente de alimentación mantendrá el dispositivo en marcha mientras realizas el cambio.
- Sistemas SAI
Un sistema de alimentación ininterrumpido (SAI) proporciona una corriente continua, incluso en caso de corte del suministro eléctrico. Los sistemas SAI, que se encuentran en casi todos los centros de datos empresariales, "limpian" la energía de los sistemas de TI y tienen sistemas de reserva de baterías y generadores de emergencia, lo que permite que la instalación funcione incluso sin alimentación eléctrica.
Puede que este nivel de asistencia no sea práctico para una instalación Edge. Cada rack de servidores debería tener al menos un sistema SAI con baterías integradas y adaptadas a la carga instalada, para mantener la energía en caso de un corte del suministro eléctrico o una bajada de la tensión. Los sistemas SAI para Edge no están diseñados para admitir un funcionamiento a largo plazo, sino para ofrecer suficiente tiempo para tener una desactivación ordenada de los sistemas afectados.
Si es práctico, los sistemas SAI redundantes en un rack deben conectarse a un disyuntor diferente (idealmente en una caja eléctrica diferente) para garantizar una disponibilidad constante. Si hubiera un problema eléctrico con uno de los circuitos o cajas, no fallará todo el rack.
- Refrigeración
La refrigeración es tan esencial para el Edge como la alimentación, ya que evita que los equipos se calienten en exceso y minimiza la probabilidad de fallos. Una vez más, puede que no sea práctico proporcionar los mismos niveles de redundancia que se encuentran en el centro de datos, pero aún puedes asegurar el máximo nivel de climatización en el Edge.
Para una instalación Edge independiente de un solo equipo, se puede instalar un aire acondicionado montado en rack, como el Blue e+; incluso se pueden instalar dos en el mismo equipo para proporcionar una redundancia N+1. A medida que crezca la instalación de Edge, también lo hará la capacidad necesaria para la climatización y la eliminación del calor. Los sistemas de circuito cerrado y acoplamiento cerrado basados en el sistema LCP DX pueden proporcionar mayores capacidades de eliminación de calor, al mismo tiempo que admiten múltiples equipos en una sola hilera o módulo.
Si vamos más allá de la instalación independiente del Edge en un solo armario, la refrigeración por hileras también puede proporcionar una climatización específica para el centro de datos tipo Spine o Edge, ya sea en una sala dedicada, un contenedor independiente o un espacio similar.
Para cualquiera de estas implementaciones, las redundancias a nivel del armario o la hilera ofrecen una garantía adicional para lograr el máximo tiempo de actividad. Las diferentes soluciones de refrigeración de Rittal, por ejemplo, cuentan con intercambiadores de calor, alimentaciones eléctricas, ventiladores y sensores de temperatura redundantes.
Conclusión
No se puede sobrevalorar la importancia de la redundancia; sin ella, todos los equipos de tu instalación de Edge pueden ser vulnerables a fallos provocados por un corte eléctrico, un sobrecalentamiento y otras amenazas, y el resultado podría ser catastrófico. Mediante estas pautas básicas y los conocimientos de expertos en refrigeración, los administradores de instalaciones pueden tener la tranquilidad de saber que sus equipos seguirán funcionando con normalidad, incluso cuando las condiciones indiquen todo lo contrario.
Para obtener más información sobre lo que se necesitas para lograr una eficiencia de Edge óptima, descarga nuestro Whitepaper "El futuro del Edge Computing. Ventajas para 2022 y en adelante". Aquí podrás obtener más información sobre cómo podemos diseñar, planificar y administrar tu Edge Data Center y la instalación de la infraestructura necesaria para lograr una eficiencia y una fiabilidad del Edge óptimas.