SoloCodigo

CLR: .Net / Mono / Boo / Otros CLR => C# => Mensaje iniciado por: murdock en Lunes 24 de Noviembre de 2008, 13:14

Título: problema con arboles DOM
Publicado por: murdock en Lunes 24 de Noviembre de 2008, 13:14
Buenas a todos, primero decir que no se si este post iria colocado en este subforo, sino es asi, moverlo por favor y disculpadme. Por otro lado estoy implementando un modulo para iis7, donde le llega una peticion html, el contenido de esa pagina la tengo que pasar a arbol dom, para obtener todas las etiquetas "a" (para conseguir un listado de los enlaces de esa web). He probado de 2 maneras y ambas me fallan:

1) mediante XmlDocument, el problema que me da es que casi todas las webs, tienen codigo mal escrito, etiquetas mal cerradas, o que empiezan con algunos caracteres en mayuscula y otros en minuscula... y al no coincidir el comienzo de etiqueta con su cierre salta excepcion.

2) mediante WebBrowser, el problema que me da aqui es un error con el activex, he leido que hay que usar: "[STAThread]"  para evitar esto, pero el problema es que por lo que tengo entendido hay que colocarlo antes del main, y en la programacion de mi modulo no tengo ningun main, la funcion de arranque para mi es init( ), y colocandolo delante de la misma tambien falla

Alguien podria ayudarme, estoy atascado y la verdad que no se como resolverlo :S, si necesitais mas datos pedirmelos

un saludo!