martes, 17 de agosto de 2010

Haciendo el deployment con MDT 2010 y resolviendo algunos problemas… (heartbeat!)…

Bueno, después de haber realizado mis pruebas en laboratorio con MDT 2010 update 1 y WDS 2008 R2 y ser exitosas, llego el momento de probar en un entorno real, es decir llevar a un centro para instalar 200 equipos con Windows 7. Se llevó físicamente el servidor que utilice para probar al centro, se enchufo se colocó la red (nota que no hay DHCP ahí ni nada parecido así que la infraestructura virtualizada tendría que servir), y empezamos la instalación por red. Así que para agilizar se empezó a configurar las 10 primeras computadoras (procedimiento detallado en mi anterior blog, apretar F12, etc.), y llegó un momento donde la instalación no continuó!.. se quedó como ‘esperando’.. yo creí que era porque muchas máquinas estaban haciendo request y quizá habría que esperar que todas lleguen a ese punto. En todo caso no avanzaba nada, y en una de las máquinas me salió un error (ver la foto), ese error decía que no podía leer el archivo *.wim, era muy raro ya que hasta ese momento todo pudo ir sin problemas.
El mensaje de error

Bueno así que tuve que revisar el servidor para ver si había algo raro y si las conexiones estaban bien, etc. Todo funcionaba, así que ahora probé con otra máquina pero esta vez en el MDT seleccione otra tarea de pasos (para que agarre otro archivo WIM), como era sólo una maquina fue más rápido, pero llego exactamente hasta el mismo punto que las anteriores, hice una revisión de los logs de MDT (accedes al command prompt presionando F5), y ahí en el C:\MININT\SMSOSD\OSDLOGS\SMSTS.log junto con el ltiapply.log eran los últimos actualizados, en ambos estaba esta entrada:
LOG[ZTI Heartbeat: command has been running for 6 minutes

Y el tiempo iba cambiando (7 minutes, 10 minutes, etc.) y no avanzaba nada el progreso.

Me parecía muy raro ya que probé la misma maquina (hardware) y funcionaba en mi lab, así que se me ocurrió probar en el mismo Hyper-V server nuevamente un deploy de una virtual con WDS así que cree una máquina nueva y funcionó!, así que el WIM file no estaba corrupto y completó la instalación en menos de 12 minutos (en el mismo server)…. Luego recordé que en mi prueba las computadoras estaban bajo un Hub (si si, es mi Hub que tengo hace años, como era lab de prueba no importaba no? J), y funcionaba perfectamente. Desconfié de la comunicación que había entre los equipos así que más bien había un Switch extra por ahí, donde conectamos 9 equipos (no alcanzaba más el cable), ya que no quería que se use el switch donde todos estos equipos estaban conectados (miren imagen, no era nada despreciable), una vez conectado, todas las máquinas comenzaron a continuar!, el heartbeat message salto y el autodeployment funcionó!, tardo unos 45 minutos, pero las 9 máquinas estaban listas!, bueno, entonces cual es el problema?, el switch no deja pasar algún paquete especial?, en fin, hay dudas que el administrador de la red tendrá que responder, en todo este ‘troubleshoot’ se perdió más de 5 horas, pero ahora se puede continuar el deployment de las 200 máquinas que para variar se necesitan urgente!.

El famoso switch :)

Update: por si acaso se hizo un deploy de 20 máquinas en 1 hora y media.. hay que recalcar que mi server donde está el WDS y MDT esta virtualizado, si bien esta en un disco extra las imágenes, me gustaría que tenga un RAID 0 por lo menos :), y claro tener una tarjeta de red dedicada, en fin, no estaba pensado para hacer un deploy de 200 era solo un lab, pero al final sirvió para este fin, ya les contare si hay noticias del administrador de red y porque en ese switch no funcionó el autodeployment hasta que fue reemplazado solo para el autodeployment porque por lo demás funciona bien! :)…

No hay comentarios:

Publicar un comentario