¿Cómo extraer datos de una página web?

28/02/2006 - 22:14 por XTV | Informe spam
Hola a tod@s;

necesito crear un programa que sea capaz de extraer a una base de datos
los movimientos bancarios que se muestran en diferentes servicios de banca
por internet. La idea es poder leer la fecha de los movimientos junto con su
descripción y el valor del moviento.

El problema es que cada banco usa un formato concreto y diferente al
resto, tal vez necesite hacer un parser diferente para cada banco; lo que
pasa es que no sé cómo hacerlo.

¿Se le ocurre a alguien cómo hacerlo, o alguna otra solución?

Muchas gracias

Preguntas similare

Leer las respuestas

#1 A.Poblacion
28/02/2006 - 22:29 | Informe spam
"XTV" wrote in message
news:
necesito crear un programa que sea capaz de extraer a una base de datos
los movimientos bancarios que se muestran en diferentes servicios de banca
por internet. La idea es poder leer la fecha de los movimientos junto con
su descripción y el valor del moviento.

El problema es que cada banco usa un formato concreto y diferente al
resto, tal vez necesite hacer un parser diferente para cada banco; lo que
pasa es que no sé cómo hacerlo.

¿Se le ocurre a alguien cómo hacerlo, o alguna otra solución?



Eso se denomina "screen-scraping" ("rascado de pantalla") y hay varias
técnicas para conseguirlo, casi todas basadas en el empleo de expresiones
regulares (clase RegEx en .Net). Cambiando la expresión regular se puede
conseguir extraer los datos deseados de distintas páginas web sin modificar
el programa. Tienes código de ejemplo en este artículo:

http://msdn2.microsoft.com/en-us/li...90407.aspx
Respuesta Responder a este mensaje
#2 XTV
01/03/2006 - 10:38 | Informe spam
Muchas gracias; tiene muy buena pinta lo que me has mandado, voy a intentar
utilizarlo

El unico problema que le veo es que no es una página estatica, es el
resultado de una consulta que se hace bajo https, no puedo poner una simple
URL.

Si alguien ve cómo solucionar esto se lo agradecería mucho

XTV


"A.Poblacion" escribió en
el mensaje news:u7e%
"XTV" wrote in message
news:
necesito crear un programa que sea capaz de extraer a una base de
datos los movimientos bancarios que se muestran en diferentes servicios
de banca por internet. La idea es poder leer la fecha de los movimientos
junto con su descripción y el valor del moviento.

El problema es que cada banco usa un formato concreto y diferente al
resto, tal vez necesite hacer un parser diferente para cada banco; lo que
pasa es que no sé cómo hacerlo.

¿Se le ocurre a alguien cómo hacerlo, o alguna otra solución?



Eso se denomina "screen-scraping" ("rascado de pantalla") y hay varias
técnicas para conseguirlo, casi todas basadas en el empleo de expresiones
regulares (clase RegEx en .Net). Cambiando la expresión regular se puede
conseguir extraer los datos deseados de distintas páginas web sin
modificar el programa. Tienes código de ejemplo en este artículo:

http://msdn2.microsoft.com/en-us/li...90407.aspx



Respuesta Responder a este mensaje
#3 Victor
02/03/2006 - 23:38 | Informe spam
Existe una norma bancaria estandarizada denominada Q43 que la mayoría de
bancos tienen y que te resolvería muy bien el problema, yo en tu lugar
atacaría primero por esta vía.

Espero que te sirva, un saludo.

"XTV" escribió en el mensaje
news:
Hola a ;

necesito crear un programa que sea capaz de extraer a una base de


datos
los movimientos bancarios que se muestran en diferentes servicios de banca
por internet. La idea es poder leer la fecha de los movimientos junto con


su
descripción y el valor del moviento.

El problema es que cada banco usa un formato concreto y diferente al
resto, tal vez necesite hacer un parser diferente para cada banco; lo que
pasa es que no sé cómo hacerlo.

¿Se le ocurre a alguien cómo hacerlo, o alguna otra solución?

Muchas gracias


email Siga el debate Respuesta Responder a este mensaje
Ads by Google
Help Hacer una preguntaRespuesta Tengo una respuesta
Search Busqueda sugerida