VMware vCenter Operations Manager
Hola soy Miguel Ángel Alonso y aquí estoy como cada lunes para contaros algo nuevo del maravilloso y siempre apasionante mundo de la virtualización, en el día de hoy vamos a hablar sobre la mejor herramienta de análisis, performance y monitorización que conozco en entornos virtualizados de VMware.
Esta herramienta, es la más que conocida vCenter Operations Manager o vCops, cómo hablar de ella en particular nos llevaría muchísimo tiempo, me he centrado en la parte que quizás más te interesa y que nos va a ayudar y mucho en los problemas cotidianos de nuestro entorno VMware. Básicamente vas a ver cómo interpretar las principales métricas que vCops nos muestra para entender de manera sencilla que es lo que está ocurriendo en nuestro entorno y solventarlo de la manera más rápida posible.
vCenter Operations puede tomar miles de métricas desde vCenter Server y resumir hasta en 3 acciones (super-metricas) principales básicamente: la carga de trabajo, la salud y capacidad (WORKLOAD, HEALTH y CAPACITY). Estas son piezas críticas de información que te ayudarán a poder encontrar la mayoría de los problemas de tu infraestructura.
CAPACITY
La capacidad es bastante simple. Básicamente hace una estimación de cuando voy a quedar me sin recursos en mi Infraestructura, basándose en como hago uso de esta en el tiempo. Valiosa, pero no quiero concentrar me en ella hoy
WORKLOAD
Vamos a desglosar y hablar sobre la carga de trabajo (WORKLOAD). La Carga de trabajo, en pocas palabras, es una medición que muestra la relación de la demanda de recursos de un objeto virtual (VM, ESX, Cluster) versus la cantidad de recursos que estos pueden obtener. La proporción resultante es una puntuación que te ayudará a entender la difícil con la que un objeto virtual está trabajando en su entorno.
Si la puntuación de la carga de trabajo es baja (por ejemplo 20) un objeto tiene un montón de recursos a su disposición. Cuanto mayor sea la puntuación de la carga de trabajo más cerca está nuestro objeto virtual de quedarse sin sus recursos necesarios.
Una puntuación de la carga de trabajo por encima de 100 (sí, puede ser > 100) significa que el objeto virtual está muriéndose de hambre (permite me la expresión) por la falta de recursos (CPU, memoria, E/S de red o almacenamiento E/S).
HEALTH:
Mide el estado de “normalidad” o “salud” de un objeto virtual en una escala de 0-100. Una puntuación de 100 significa que estos objetos virtuales (Cluster, ESX, VMs, etc..) se comportan normalmente. Una puntuación menor de salud indica que el objeto virtual está actuando anormalmente (no necesariamente tiene un problema) y puede ser que necesite tu atención.
No voy entrar en los detalles de cómo se calcula la salud en este momento pero si es posible que en un próximo post del blog lo haga porque es realmente muy interesante, pero por ahora vamos a dejarlo así.
Puedes utilizar estos dos super-metricas para las mejores prácticas de tu Infraestructura
Voy a daros unos claros ejemplos para que podáis entender mejor como interpretar las diferentes métricas y combinaciones que nos proporciona vCOPS:
High Workload/Low Health : un objeto virtual está “muriéndose de hambre” por falta de recursos y está actuando de forma anormal (por ejemplo: este objeto normalmente tiene un montón de recursos a su disposición en todo momento). Esta situación requiere atención inmediata, porque se ven afectados los servicios que normalmente se ejecutan sin problemas.
Normal Workload/Low Health : un objeto virtual tiene un montón de recursos, pero algo le hace actuar de diferente manera de lo normal (es decir, tal vez alguien ha hecho un cambio en las configuraciones de la/s VM/s). Esto no tiene que ser un problema obligatoriamente, pero definitivamente requiere más investigación desde vCenter Operations para determinar qué medidas tomar.
High Workload/High Health : un objeto virtual que corre en caliente el cual puede tener falta de recursos, pero la salud nos indica que es alta, por lo que este podría ser el comportamiento normal de este objeto durante esta parte del día (es decir, se ejecuta un proceso programado, o por la mañana todos los usuarios están empezando a iniciar sesión la sesión del día, etc..). Los usuarios se quejan sobre la respuesta del sistema, aunque tú sepas que esto está dentro de lo normal deberías comenzar a pensar en proporcionar más recursos.
Bueno caballeros!! Hasta aquí por hoy, espero haber te podido contar algo de tu interés y te emplazo hasta la semana que viene con un nuevo capítulo del maravilloso mundo de la virtualización. Hasta la semana que viene!!
Si te ha gustado este articulo, por favor,compártelo en Twitter o en Facebook con los botones de abajo. Muchas gracias por tu apoyo!