SoloCodigo

Programación Web y Scripting => Python => Mensaje iniciado por: jarugama11 en Martes 11 de Agosto de 2009, 22:42

Título: Urllib y html en python3
Publicado por: jarugama11 en Martes 11 de Agosto de 2009, 22:42
Hola, y saludo a todos los lectores.

Me gustaria saber si existe algun modulo que me ayude a extraer o tratar informacion util de los html, ya que en el python 3 cambio un poco lo de urllib.

La verdad la unica forma que se me ocurre de extraer el texto, texto de las tablas, o informacion util de un html es con expresiones regulares pero para eso tendria que empezar por aprender html y no es uno de mis objetivos( no es que sea vago, esq no dispongo de ese tiempo) y se me daria toda la vida haciendo ese codigo ya que html tiene un gran numero de etiquetas. He buscado un poco y encontre algo sobre  sgmllib pero no lo puedo importar en python 3 y me gustaria saber si alguien tiene conocimiento sobre esto.

Muchas gracias de antemano