Problema con cluster W2000

30/05/2005 - 22:57 por Packo | Informe spam
Hola compañeros, hace mucho que no pasaba por aqui y siento que sea con un
problema, pero espero poder volver a ser 'asiduo'. Bueno al tema:
Se nos ha roto un disco de un raid5 de un cluster, al cambiarlo por otro se
ha cometido el error de ponerlo online en lugar de recostruirlo (es un
cluster de HP con controladoras net raid), a partir de ese momento han
empezado a fallar ciertos archivos de ese raid diciendo que estaban
corruptos. Hemos puesto el disco offline y luego online y hemos recostruido
el raid, terminando aparentemente bien aunque seguía diciendo que el disco
estaba corrupto. Antes de pasarle un chkdsk para ver si corregia algo, hemos
tenido la feliz idea de reiniciar los dos nodos y ahora estamos en un punto
que ninguno de los 2 nodos ve ninguno de los discos del cluster (si aparecen
en Mi PC pero no tienen acceso a ellos), incluido el de quorum, con lo que no
hay manera de levantar el servicio de cluster, o al menos que un servidor vea
los discos en local. Tambien nos ha pasado un par de veces que los dos nodos
han dado un pantallazo azul ("page fault on nonpaged area"), pero me parece
raro que pase en los dos nodos a la vez, con lo que pienso que será del disco.

Se agradece cualquier sugerencia al respecto, pq imagino que la noche será
larga :(

Salu2
Packo
 

Leer las respuestas

#1 fegume
31/05/2005 - 12:51 | Informe spam
Paco, no he tocado cluster, pero se como funcionan y el tema de Raid lo llevo
bien, asi que espero ayudarte en algo.

Has probado a quitar el disco que pusistes online y arrancar con lo que
tenias antes de que se te estropera el disco. Si te arranca bien, no me
complicaria mas la vida, llama a HP y que te cambien de nuevo el disco y
despues, reconstruyelo antes de nada, de todos modos te digo que la
reconstrucion dependiendo de los datos que tengas, puede tardar incluso 8
-10horas.

"Packo" escribió:

Hola compañeros, hace mucho que no pasaba por aqui y siento que sea con un
problema, pero espero poder volver a ser 'asiduo'. Bueno al tema:
Se nos ha roto un disco de un raid5 de un cluster, al cambiarlo por otro se
ha cometido el error de ponerlo online en lugar de recostruirlo (es un
cluster de HP con controladoras net raid), a partir de ese momento han
empezado a fallar ciertos archivos de ese raid diciendo que estaban
corruptos. Hemos puesto el disco offline y luego online y hemos recostruido
el raid, terminando aparentemente bien aunque seguía diciendo que el disco
estaba corrupto. Antes de pasarle un chkdsk para ver si corregia algo, hemos
tenido la feliz idea de reiniciar los dos nodos y ahora estamos en un punto
que ninguno de los 2 nodos ve ninguno de los discos del cluster (si aparecen
en Mi PC pero no tienen acceso a ellos), incluido el de quorum, con lo que no
hay manera de levantar el servicio de cluster, o al menos que un servidor vea
los discos en local. Tambien nos ha pasado un par de veces que los dos nodos
han dado un pantallazo azul ("page fault on nonpaged area"), pero me parece
raro que pase en los dos nodos a la vez, con lo que pienso que será del disco.

Se agradece cualquier sugerencia al respecto, pq imagino que la noche será
larga :(

Salu2
Packo

Preguntas similares