Caida de toda la red durante 50/60 segundos?

16/11/2006 - 12:10 por Capitan_torpe | Informe spam
Tenemos una red con dominio, sobre Win2000 server, en la que hay como 240
maquinas de todo tipo, todas en TCP/IP, incluidos algunos MAC, impresoras
etc..
He intentado desactivar cualquier otro protocolo (Apple talk, IPX, etc.)
en todas las maquinas.
En Julio ya tuvimos 2 o 3 caidas asi, y ahora otra vez, es como si le
quitaran la alimentacion a los switches y se la volvieran a dar.
La electronica de red esta alimentada con SAI, el corte es simultaneo en
todas las maquinas (mismo minuto y segundo) segun los logs, y se recupera
el solo en 1 minuto mas o menos.
He puesto un ethereal en algun puerto de servidor, pero no me dice nada
especial y no puedo monitorizar todo, todo el tiempo.
La red esta formada por conexiones a 100Mb para los pc's de usuario y los
servidores, y enlaces entre switches a 1Gb.
Los switches no son de pacotilla, (Allied Telesync)
He hecho un monton de pruebas mas, que no detallo por no alargarme

Alguien me sugirio compartimentar la red en sub-redes, pero sería un
trabajo brutal y no creo que arregle el problema, no creo que estemos
saturando el ancho de banda.

Este problema me tiene muy desconcertado.

Perdon por este "ladrillo"...

Agradeceré infinitamente cualquier sugerencia, link, etc. que me
indiqueis...

Muchas gracias

Preguntas similare

Leer las respuestas

#1 Fernando Reyes [MS MVP]
16/11/2006 - 12:27 | Informe spam
¿Has mirado el visor de sucesos del servidor, por si tiene alguna
información al respecto?

Un saludo
Fernando Reyes [MS MVP]
MCSE Windows 2000 / 2003
MCSA Windows Server 2003
http://freyes.svetlian.com
http://www.bloglines.com/blog/urpiano

(Corta las dos orejas si quieres escribirme)



Y fue Capitan_torpe () quien en el mensaje
, planeando sobre su teclado, hizo
un picado y tecleó:

Tenemos una red con dominio, sobre Win2000 server, en la que hay como
240 maquinas de todo tipo, todas en TCP/IP, incluidos algunos MAC,
impresoras etc..
He intentado desactivar cualquier otro protocolo (Apple talk, IPX,
etc.) en todas las maquinas.
En Julio ya tuvimos 2 o 3 caidas asi, y ahora otra vez, es como si le
quitaran la alimentacion a los switches y se la volvieran a dar.
La electronica de red esta alimentada con SAI, el corte es simultaneo
en todas las maquinas (mismo minuto y segundo) segun los logs, y se
recupera el solo en 1 minuto mas o menos.
He puesto un ethereal en algun puerto de servidor, pero no me dice
nada especial y no puedo monitorizar todo, todo el tiempo.
La red esta formada por conexiones a 100Mb para los pc's de usuario y
los servidores, y enlaces entre switches a 1Gb.
Los switches no son de pacotilla, (Allied Telesync)
He hecho un monton de pruebas mas, que no detallo por no alargarme

Alguien me sugirio compartimentar la red en sub-redes, pero sería un
trabajo brutal y no creo que arregle el problema, no creo que estemos
saturando el ancho de banda.

Este problema me tiene muy desconcertado.

Perdon por este "ladrillo"...

Agradeceré infinitamente cualquier sugerencia, link, etc. que me
indiqueis...

Muchas gracias
Respuesta Responder a este mensaje
#2 Capitan_torpe
16/11/2006 - 13:28 | Informe spam
Nada relevante, creo yo pero te adjunto lo que me dice:

Primero una advertencia:
Tipo de suceso: Advertencia
Origen del suceso: PAdminDB
Categoría del suceso: Ninguno
Id. del suceso: 10
Fecha: 16/11/2006
Hora: 9:34:09
Usuario: No disponible
Equipo: MY-DOM
Descripción:
Error in database access layer, Error was:
Method:{CDBEvidences::GetNumCRCsNotSentToMachines} - Error
Code: 800A0E7D
Code meaning: Unknown error 0x800A0E7D
Source: ADODB.Command
Description: The connection cannot be used to perform this operation. It
is either closed or invalid in this context.


Luego un error:
Tipo de suceso: Error
Origen del suceso: PAdminDB
Categoría del suceso: Ninguno
Id. del suceso: 2
Fecha: 16/11/2006
Hora: 9:34:09
Usuario: No disponible
Equipo: MY-DOM
Descripción:
Error opening database:
Method:{CPAdminDBConn::GetConnection} - Error
Code: 80004005
Code meaning: Error no especificado
Source: Microsoft OLE DB Provider for SQL Server
Description: [DBNETLIB][ConnectionOpen (Connect()).]SQL Server does not
exist or access denied.

Esto es el servidor de dominio primario, en los otros registros del visor
de sucesos no hay nada relativo a este corte

Gracias por tu ayuda.






"Fernando Reyes [MS MVP]"
escribio en news:#:

¿Has mirado el visor de sucesos del servidor, por si tiene alguna
información al respecto?

Respuesta Responder a este mensaje
#3 Fernando Reyes [MS MVP]
16/11/2006 - 17:20 | Informe spam
¿No podría ser que se lanzase un proceso en determinado momento que sature
la red? Yo he visto como dos equipos de un total de 15 tumbaban un switch de
24 puertos porque estaban infectados con el Blaster.

Un saludo
Fernando Reyes [MS MVP]
MCSE Windows 2000 / 2003
MCSA Windows Server 2003
http://freyes.svetlian.com
http://www.bloglines.com/blog/urpiano
freyes.tururú@tururú.mvps.org
(No toques la corneta para escribirme)



Y fue Capitan_torpe () quien en el mensaje
, planeando sobre su teclado, hizo
un picado y tecleó:

Nada relevante, creo yo pero te adjunto lo que me dice:

Primero una advertencia:
Tipo de suceso: Advertencia
Origen del suceso: PAdminDB
Categoría del suceso: Ninguno
Id. del suceso: 10
Fecha: 16/11/2006
Hora: 9:34:09
Usuario: No disponible
Equipo: MY-DOM
Descripción:
Error in database access layer, Error was:
Method:{CDBEvidences::GetNumCRCsNotSentToMachines} - Error
Code: 800A0E7D
Code meaning: Unknown error 0x800A0E7D
Source: ADODB.Command
Description: The connection cannot be used to perform this operation.
It is either closed or invalid in this context.


Luego un error:
Tipo de suceso: Error
Origen del suceso: PAdminDB
Categoría del suceso: Ninguno
Id. del suceso: 2
Fecha: 16/11/2006
Hora: 9:34:09
Usuario: No disponible
Equipo: MY-DOM
Descripción:
Error opening database:
Method:{CPAdminDBConn::GetConnection} - Error
Code: 80004005
Code meaning: Error no especificado
Source: Microsoft OLE DB Provider for SQL Server
Description: [DBNETLIB][ConnectionOpen (Connect()).]SQL Server does
not exist or access denied.

Esto es el servidor de dominio primario, en los otros registros del
visor de sucesos no hay nada relativo a este corte

Gracias por tu ayuda.






"Fernando Reyes [MS MVP]"
escribio en
news:#:

¿Has mirado el visor de sucesos del servidor, por si tiene alguna
información al respecto?
Respuesta Responder a este mensaje
#4 Capitan Torpe
17/11/2006 - 06:49 | Informe spam
Hola Fernando, todos los pc's estan al dia con Panda (Client Shield)
monitorizados desde el servidor de dominio, pero forzare un analisis del
antivirus a todas las maquinas.
Los switches son de 48 tomas 10/100`+ 2 tomas 1Gb linkados a 4 switches
de 10x 1Gb donde entran los links + los servidores. Entiendo que me hagan
caer un switch, pero no se como este puede encadenar la caida de toda la
red.
Yo pienso en estas posibilidades:
1-Uno de los switch no funciona muy bien (siempre que nos ha pasasdo
estabamos en horas de pleno trafico, dia laborable por la mañana).
2-La tarjeta de red de un PC nos esta haciendo la fiesta, (pero no se,
porque seria algo intermitente)
3-Alguien se ha instalado algo en plan (escaneo continuo de puertos, de
todas las maquinas que veo etc.)

Gracias por tu ayuda


"Fernando Reyes [MS MVP]"
wrote in
news::

¿No podría ser que se lanzase un proceso en determinado momento que
sature la red? Yo he visto como dos equipos de un total de 15 tumbaban
un switch de 24 puertos porque estaban infectados con el Blaster.

Respuesta Responder a este mensaje
#5 Fernando Reyes [MS MVP]
17/11/2006 - 10:02 | Informe spam
Sí, todo lo que sugieres es posible, principalmente dos causas:

1.- Algún switch falla
2.- Algún equipo provoca un trafico exagerado que "tumba" los switches.

Para la segunda causa, puedes ejecutar netstat en los equipos para ver si
localizas a alguno que esté haciendo un barrido, sobre todo cuando veas que
está tumbado un switch.

No descartes la aparición de un virus: en ese caso que te he contado, los
dos equipos que te cuento estaban con antivirus actualizado y el virus se
reía del antivirus, verás por qué: vi el tráfico que estaban generando, con
netstat, e inmediatamente sospeché que era el blaster, por el escaneo que
realizaban por puertos RPC, así que me bajé el Stinger de McAfee y al
ejecutarlo apareció el bicho. Limpiar y acabarse el problema. La forma en
que aislé estos equipos fue muy "dolorosa": desconecté de switch todos los
equipos menos el servidor, pinché uno y vi si se tumbaba el switch, otro,
otro, así sucesivamente hasta que alguno tumbaba el switch, lo desconectaba
y seguía con el resto, hasta que lo tumbase otro. De esa manera localicé a
los dos causantes, usé netstat, ví ese barrido RPC, baje el Stinger, lo
ejecuté en los dos equipos y se acabó el problema.

Un saludo
Fernando Reyes [MS MVP]
MCSE Windows 2000 / 2003
MCSA Windows Server 2003
http://freyes.svetlian.com
http://www.bloglines.com/blog/urpiano

(Tírate de la moto si quieres escribirme)



Y fue Capitan Torpe (gardenias|@silasquieres.ya) quien en el mensaje
, planeando sobre su teclado,
hizo un picado y tecleó:

Hola Fernando, todos los pc's estan al dia con Panda (Client Shield)
monitorizados desde el servidor de dominio, pero forzare un analisis
del antivirus a todas las maquinas.
Los switches son de 48 tomas 10/100`+ 2 tomas 1Gb linkados a 4
switches de 10x 1Gb donde entran los links + los servidores. Entiendo
que me hagan caer un switch, pero no se como este puede encadenar la
caida de toda la red.
Yo pienso en estas posibilidades:
1-Uno de los switch no funciona muy bien (siempre que nos ha pasasdo
estabamos en horas de pleno trafico, dia laborable por la mañana).
2-La tarjeta de red de un PC nos esta haciendo la fiesta, (pero no se,
porque seria algo intermitente)
3-Alguien se ha instalado algo en plan (escaneo continuo de puertos,
de todas las maquinas que veo etc.)

Gracias por tu ayuda


"Fernando Reyes [MS MVP]"
wrote in
news::

¿No podría ser que se lanzase un proceso en determinado momento que
sature la red? Yo he visto como dos equipos de un total de 15
tumbaban un switch de 24 puertos porque estaban infectados con el
Blaster.
Respuesta Responder a este mensaje
Ads by Google
Help Hacer una preguntaSiguiente Respuesta Tengo una respuesta
Search Busqueda sugerida