Mi experiencia con Servidores en Data Centers: noviembre 2010

martes, 30 de noviembre de 2010

Del tamaño de los Racks

Hay racks del tipo “corto” y racks del tipo “largo” (que miden aproximadamente 1mts de profundidad). Nosotros cometimos el error de adquirir racks cortos debido a: 1) Falta de espacio en el data center, y 2) Los servidores que se iban a colocar allí eran del tipo Tower que cabían perfectamente. La primera razón es la consecuencia del error cometido por nuestros consultores en cuanto al tamaño del Data center, la segunda razón fue el desconocimiento de la tendencia de los servidores del tipo “rackeable” que es la de crecer más a lo largo que a lo alto... inclusive los tipo tower de perfil corporativo, también se volvieron más profundos con el pasar del tiempo.

Este error lo pagamos algunos años después cuando, debido a la inevitable renovación tecnológica, adquirimos servidores “rackeables” que nos obligaron a cambiar dos de los racks “cortos” por “largos” (los otros fue imposible debido al tamaño del Data Center).

martes, 23 de noviembre de 2010

Como "acercar" los Servidores a los Switches

Nuestro Data center se estructuró de una forma tradicional: una hilera de racks con servidores y atrás media hilera de racks con los equipos de comunicaciones. El problema de este enfoque es que, para cada interfaz de red de cada servidor, sale un cable que recorre todo el Data Center para alcanzar finalmente los switches del Core de la LAN. Recientemente he visto alternativas en las cuales los racks de los switches están en la mitad de la hilera de los racks de servidores, mejor aún: se pueden poner en cada rack un switch al cual se conectan los servidores de ese rack y estos son conectados mediante fibra al swich maestro que podría estar colocado en la mitad de la hilera de servidores. De esta manera las conexiones de los servidores son mucho más simples, los cables más cortos, se puede ver fácilmente a que puertos están conectados y otras ventajas adicionales.

martes, 16 de noviembre de 2010

La SAN HP EVA 4100

A finales del 2007 se hizo preciso mejorar la plataforma del Core Bancario, hasta ese momento residía en un servidor Sun V440 con 6GBytes de memoria RAM, 4 discos internos de 36GBytes y un arreglo de discos externos de 5 discos cada uno de 72Gbytes que, en RAID-5, dejaban disponibles unos 250GBytes. Se decidió entonces pasar a un esquema de Cluster del tipo Activo –Pasivo (ya que el licenciamiento de Oracle hacía prohibitivo tener dos servidores en modalidad Activo – Activo) y se optó la solución de HP con Service Guard.

Para resolver el problema del almacenamiento, se decidió adquirir un EVA 4100 de HP con 8 discos de 300GBytes c/u que finalmente dejaban libres unos 2240Gbytes… ya el administrador podría decidir como dividir los volúmenes de este dispositivo y con que tipo de redundancia (RAID-0, 1 o 5).

Al EVA 4100 se conectaron los dos servidores HP rx3600 con HPUX (que integrarían el Cluster Activo – Pasivo) y un servidor DL380 G5 que haría funcionas de NAS para Windows (teóricamente ese servidor debería estar encargado únicamente de tener la interfaz al EVA, pero hubiese sido un gran desperdicio hacerlo de esa manera).

Para lograr el efecto del Cluster Activo – Pasivo con Service Guard (sobre el cual escribiré posteriormente), se hicieron varios volúmenes de datos:

1) El de Bases de Datos Oracle para el Core Bancario con 500GBytes en RAID-1

2) El del Oracle Application Server para el Core Bancario con 45GBytes en RAID-1

3) El de la Base de Datos de Fideicomisos con 100GBytes en RAID-1

4) El de la Base de Datos de Cheques Digitalizados con 100GBytes en RAID-1

5) El de los Home Folders y Carpetas compartidas para los usuarios Windows con 500GBytes en RAID-5

6) El de Respaldos especiales de 200Gbytes en RAID-0

7) El de uso interno del Cluster propiamente con 10Gbytes en RAID-1

Todo esto suma prácticamente la capacidad total del EVA.

Lo interesante del enfoque del software del EVA, es que el administrador realmente no sabe en que disco(s) reside un volumen dado, simplemente pide cierto espacio con cierta redundancia (RAID-1, RAID-5 o sin redundancia) y el EVA decide como repartirlo.

Por tres años todo funcionó a la perfección… hasta que llegó la falla!

Un mal día una alarma sonora avisó que había un desperfecto en la SAN, ingresé al utilitario que la maneja y pude ver que efectivamente todos los volúmenes menos los dos relacionados con el Core Bancario y el interno del Cluster, tenían un triángulo amarillo… dos de los discos duros físicos presentaban un error con un icono en rojo. En efectos los usuarios reportaron haber perdido sus carpetas de “Mis Documentos” así como las carpetas compartidas… pánico total!

Ejecuté los comandos necesarios para tratar de recuperar los volúmenes pero no tuve éxito. Finalmente me resigné a perder las particiones marcadas, así que recree la de Windows y bajé los datos del respaldo, ahora los volúmenes quedaron configurados de la siguiente manera:

1) El de Bases de Datos Oracle para el Core Bancario con 500GBytes en RAID-1 (no quedó afectado)

2) El del Oracle Application Server para el Core Bancario con 45GBytes en RAID-1 (no quedó afectado)

3) El de los Home Folders y Carpetas compartidas para los usuarios Windows con 400GBytes en RAID-5

4) El de uso interno del Cluster propiamente con 10Gbytes en RAID-1 (no quedó afectado)

Dado que se perdieron 2 discos, la capacidad de la SAN bajó a 1680GBytes. Por otro lado la suma teórica de la nueva configuración es de 1610Gbytes, así que estábamos bastante recuperados. Esto duró una semana… ya que falló un tercer disco!

Esta vez la falla fue menos severa ya que en ningún momento se perdió el acceso a algún volumen, lo curioso del asunto es que, a pesar que a la SAN no le quedaba prácticamente espacio disponible (creo que reportaba 8GBytes libres) y a pesar de que fallara un disco, lo cual disminuía la capacidad teórica a 1400GBytes (sensiblemente menos de lo reservado por los volúmenes), la SAN continuó funcionando sin pérdida de datos y ni siquiera reportó que removiese algún tipo de redundancia para tener más espacio. Eso si, se sumergió en un estado de “leveling” desde el primer día (un martes) y el tiempo de respuesta del Core bancario aumentó sensiblemente (el cierre del Core Bancario diario tardaba el cuádruple).

Dado que, evidentemente, la situación no era estable más el temor que fallara un cuarto disco, comenzamos una actividad febril de sacar a los Home Folders y las Carpetas compartidas de la SAN: la idea era la de eliminar el volumen para Windows devolviéndole todo el espacio a la SAN para que el Core bancario pudiese funcionar como lo hacía antes de la falla. Este procedimiento se culminó el jueves por la noche, los volúmenes quedaron así:

1) El de Bases de Datos Oracle para el Core Bancario con 500GBytes en RAID-1 (no quedó afectado)

2) El del Oracle Application Server para el Core Bancario con 45GBytes en RAID-1 (no quedó afectado)

3) El de uso interno del Cluster propiamente con 10Gbytes en RAID-1 (no quedó afectado)

El total teórico es de 1110Gbytes de los 1400 disponibles… a los pocos minutos de haber liberado el volumen de Windows, la SAN culminó su proceso de “leveling” e indicó que el espacio disponible ahora es de 30Gbytes (aun cuando dice que lo ocupado son 1100, debe ser que hay áreas adicionales dañadas). Los tiempos volvieron a los niveles normales anteriores a la falla… se acabó la crisis!

Anécdota: Al producirse la primera falla llamé al servicio técnico de HP para que me atendieran, en ese momento me informaron que el contrato de mantenimiento se había vencido dos días antes. Yo estoy seguro que HP no “planea” sus fallas para justo después de que venzan los contratos de mantenimiento… pero de que vuelan vuelan!

martes, 9 de noviembre de 2010

Sobre la marca de los Racks

Cuando se planeó el Data Center, vimos que había que traer servidores tipo Tower de las empresas que componían el conglomerado pero también se adquirirían un buen número de servidores nuevos. Para los servidores ya presentes no había mucho que hacer, pero para los nuevos traté de que se adquiriese junto con ellos el Rack del fabricante (en nuestro caso Sun y HP)… logré mi objetivo con HP pero no así con Sun. Finalmente la decisión sobre los tipos y marcas de los Racks fue de otros quienes, lamentablemente, seleccionaron Racks genéricos.

Aun cuando para los servidores Tower el tipo de Rack no importaba mucho (básicamente se instalaron uno encima del otro con la ayuda de algunas bandejas), aprendí que los servidores “rackeables” Sun y HP no pueden instalarse “sin problemas” en cualquier Rack… a los servidores Sun, que les tocó uno genérico, la instalación tomó mucho más tiempo de lo normal y se tuvieron que sacrificar los brazos con lo cual se perdió su movilidad.

Conclusión: es preferible gastar algo más de dinero comprando los Racks de la misma marca de los servidores que van a contener.

miércoles, 3 de noviembre de 2010

Distribución de los servidores en los racks

El vendedor me dijo “El rack tiene 41U, por lo tanto puedes meter hasta 41 servidores de 1U de altura o 20 de 2U”… aún cuando la cuenta matemática es exacta, en la práctica es imposible meter 41 servidores en un Rack y muy poco manejable meter a 20, la razón? Cada servidor tiene típicamente dos fuentes de poder, dos tarjetas de red y al menos una conexión al KVM (generalmente estas conexiones meten a las conexiones del Teclado, Mouse y Monitor por un solo cable físico) es decir que cada servidor tiene típicamente cinco cables largos (ya que hay que darle la holgura necesaria para deslizar el servidor hacia adelante por los rieles), con 20 servidores en el rack habría un mínimo de 100 cables dirigidos a distintos puntos del rack (los PDU, a un Switch o al KVM), esta situación es casi inmanejable.

Otra razón importante es el calor que se desprende de 40 fuentes de poder! La refrigeración también es retada fuertemente.

Mi recomendación es la de tener no más de 10-12 servidores tradicionales por rack (con los Blades la cuenta es otra). El espacio sobrante podría usarse para servidores con tamaño mayor (de 4U por ejemplo), para colocar un KVM que permita al operador trabajar con cierta comodidad o para colocar dispositivos adicionales que a menudo hay que poner: unidades de cinta pequeñas externas, discos USB externos, módems, etc.