
que trabajamos en centros de datos nos sentimos la necesidad de ampliar nuestra forma de pensar. No queremos simplemente administrar los datos de que somos responsables de mantener. Queremos transformar datos en información y van más allá: transforma la información en acciones en la forma de datos centro de automatización.
puedo realizar que incluso en el 2017, no todo el mundo tiene la oportunidad de trabajar un centro donde el monitoreo de datos y automatización trabajar juntos como un todo coherente; así, tal vez estas personas no entienden por qué estoy siendo tan enfático sobre el tema. Vamos a explorar esta cuestión.
¿por qué automatización?
usted puede preguntarse: si existe un buen sistema de control, ¿por qué es tan importante? La respuesta es: porque eres perezoso. Porque la mayoría de los profesionales es perezosa. Por qué pasar el día contestando entradas, alertas y mensajes de correo electrónico es tedioso y aburrido. Y, sobre todo, porque su tiempo vale mucho.
Ingeniero de sistemas de monitoreo, mi segundo pasatiempo favorito es cómo mis colegas respondieron a la pregunta: “¿Cómo sabes que hay algo malo?”. Esa pregunta requiere establecer mal a sí mismos, que conduce a un buen proceso del centro de datos monitoreo y alertas. Pero mi pasatiempo favorito es preguntar: “¿Qué pasa? Cuando es malo, como usted acaba de describir, ¿qué hacer sobre él? “.
la respuesta a esa pregunta es la base de la conversación que lleva a la automatización.
tal vez, después de recibir una advertencia, claro una cola, reiniciar un servicio o borrar todos los archivos en un directorio temporal.
cualquier acción, es muy probable que puede ser realizada sin intervención humana; Si se supone que la acción ya no está incorporado en la herramienta de monitoreo. Es por eso que sofisticado seguimiento soluciones le permiten crear una alerta para iniciar una medida inicial y luego esperar un tiempo determinado. Si el problema persiste, un segundo (o tercer, cuarto etc.) serán lanzados.
pero decir que no hay ninguna acción definitiva para resolver el problema. Tal vez la respuesta es verificar las última 15 líneas de un archivo de registro determinado, analizar otro contador y ejecutar una consulta de prueba desde el servidor de aplicaciones a la base de datos. Entonces, sobre la base de esta información, usted sabrá qué hacer. En este caso, la acción automatizada segui todos los pasos y escriba los resultados en el mensaje de alerta. Esto significa que usted recibirá un boleto que ya contiene una idea que necesito las condiciones en el momento de la falla y no 15 minutos más tarde, después de arrastrar a ti mismo de la cama hasta el portátil y empezar a analizar la situación.
usted puede creer: usted y su sistema de monitoreo serán héroes si lo hacen.
ahora que entendemos mejor por qué la automatización es una buena idea, vamos a repasar algunas áreas donde automation ofrece un valor sólido y medible monitoreo de disciplina en el it industria.
descubierto: primera parte
una de sus primeras acciones al activar un nuevo sistema de monitoreo está cargando los dispositivos. Aunque esto puede hacerse manualmente especificando el nombre o la dirección IP de la máquina y conexión de información, en cualquier centro de datos que tiene más de 20 sistemas, esta tarea es tediosa y frustrante. Realizar el barrido es algo mucho más conveniente y que produce una visión completa del entorno. Para aproximadamente una semana.
después de eso, en los centros de datos con más de 20 sistemas, es muy probable que algunos sistemas han sido añadidos, modificados o eliminado. Activar manualmente analiza el medio ambiente se convierte en poco práctico después de la tercera semana. Generalmente, en este momento es que nace el deseo de usar la automatización.
conectividad
Descubre múltiples dispositivos es buena, pero es mejor saber cómo se conectan. ¿Por qué? Imaginar un escenario simple en el que un router está conectado a dos conmutadores que, por su vez, están conectados a 10 servidores. Si el router se queda muerto, ¿cuántas alertas dispositivo inoperable debe obtener? Exactamente: una. Sólo uno. En el router.
, pero ¿cuántas alertas usted recibirá realmente ?
Si respondiste 10 (en servidores), 12 (en los servidores y conmutadores) o cualquier número mayor que uno, puede ser justo y, al mismo tiempo, muy mal.
la solución es configurar una supresión downstream de modo que cuando el router no funciona, los demás dispositivos aguas abajo para colocarse en un estado inalcanzable (es decir, un estado diferente de los muertos). Aunque esto puede hacerse manualmente, es mucho mejor cuando la automatización hace todo por usted.
descubrimiento: parte 2
todos los derechos, decir han encontrado todos los dispositivos ocultos en el centro de datos. Se realizó un análisis para averiguar cómo conecta. Se estableció la jerarquía de la virtualización, VM host, Cluster y para el centro de datos. Incluso se determinó que tipo de hardware, que cada dispositivo es, cuántas interfaces y cada uno tienen unidades, así como el estado del hardware físico, tales como ventiladores, sensores de temperatura, controladores RAID etcetera. Lo tienen todo calculado hacia fuera.
lo único que falta es averiguar cuál de estos Benditos los dispositivos de la máquina con el intercambio.
eso es correcto. Este descubrimiento tiene todo que ver con el software. Como en “descubrimiento: parte uno”, el objetivo aquí no es tanto la forma, pero con qué frecuencia se hace. Debido al curso puede realizar una exploración en un servidor cuando se agregan al sistema y determinar si se está ejecutando Exchange, SharePoint o la aplicación personalizada de la empresa, pero nunca se sabe (hasta que sea demasiado tarde) que tres semanas más tarde, el desarrollador de aplicaciones ha permitido IIS; o peor aún, el DHCP.
puede que necesite más para aplicaciones de automatización que al buscar nuevo, cambiado o borrado. Pero es más complicado que eso.
responsabilidad
una cosa es saber que el servidor ejecuta IIS (o el DHCP, etcetera de SharePoint). Entender cómo la empresa evalúa el servidor es otra cosa muy distinta. ¿Es una importante máquina de SharePoint o un servidor de control de calidad? Es un edificio de nueva construcción sometido a prueba o ya se está ejecutando en productividad total?
en muchas organizaciones, los servidores pasan por un proceso de fabricación y prueba antes de pasar a producción. En el otro extremo del ciclo, un servidor puede gastar una cantidad significativa de tiempo en un estado de cierre, es decir, sigue funcionando, pero sólo se utiliza en situaciones de emergencia. Del mismo modo, algunas empresas tienen sistemas que podrían migrar al producto y pruebas de control de calidad o para pruebas.
en cada uno de estos casos, la intensidad de la supervisión puede cambiar drásticamente.
así la oportunidad de automatización aquí no es tanto el descubrimiento, pero la aplicación de las plantillas correctas en base a variables personalizadas. Quiere potenciar el dueño de los equipos para que puedan definir estos atributos y luego dejar que el sistema de vigilancia para detectar y ajustar la configuración de seguimiento automáticamente de acuerdo con ellos.
por último, existe el sistema de alertas
después de todo esto, finalmente completamos el ciclo y volver a las alertas. En este punto, supongo que ya entiendes el concepto detrás de las acciones de alerta automáticas. Lo que necesitamos ahora es en profundidad. Entregar lo que prometemos.
¿cuál es el siguiente paso?
buena automatización es posible gracias a la buena supervisión. Cuando se hace correctamente, la automatización es una solución elegante y sencilla. Y lo que es aún más importante, no es algo hecho a mano; Automatización es como debe ser. Al final, el único límite para monitoreo y automatización es su capacidad para imaginar y poner en práctica, siempre y cuando usted tiene una buena herramienta de monitoreo.
Comments
0 comments
Twitter
RSS