obtener el texto de una pagina web?

25/02/2005 - 16:33 por Ignacio X. Domínguez | Informe spam
Saludos. Cual es la manera mas sencilla de obtener todo el texto de una
pagina web? de hecho tengo el codigo HTML de la pagina pero lo que quiero es
el texto sin todas las etiquetas, comentarios, scripts, vinculos (estos los
quiero como texto), etc. Hay alguna clase el C# que me permite eliminarlo de
manera similar que la funcion strip_tags() de PHP?

Gracias

Ignacio
 

Leer las respuestas

#1 Oscar Galvis
25/02/2005 - 17:11 | Informe spam
Esta gente tiene un componente q hace lo q quieres...


http://www.clevercomponents.com/pro...itenet.asp

O si quieres hacert el parse

hazle con la clase

System.Net.WebResponse

Salu2

Oscar

"Ignacio X. Domínguez" wrote in message
news:#
Saludos. Cual es la manera mas sencilla de obtener todo el texto de una
pagina web? de hecho tengo el codigo HTML de la pagina pero lo que quiero


es
el texto sin todas las etiquetas, comentarios, scripts, vinculos (estos


los
quiero como texto), etc. Hay alguna clase el C# que me permite eliminarlo


de
manera similar que la funcion strip_tags() de PHP?

Gracias

Ignacio


Preguntas similares