• Jueves 28 de Marzo de 2024, 15:36

Autor Tema:  Urllib y html en python3  (Leído 1024 veces)

jarugama11

  • Nuevo Miembro
  • *
  • Mensajes: 2
    • Ver Perfil
Urllib y html en python3
« en: Martes 11 de Agosto de 2009, 22:42 »
0
Hola, y saludo a todos los lectores.

Me gustaria saber si existe algun modulo que me ayude a extraer o tratar informacion util de los html, ya que en el python 3 cambio un poco lo de urllib.

La verdad la unica forma que se me ocurre de extraer el texto, texto de las tablas, o informacion util de un html es con expresiones regulares pero para eso tendria que empezar por aprender html y no es uno de mis objetivos( no es que sea vago, esq no dispongo de ese tiempo) y se me daria toda la vida haciendo ese codigo ya que html tiene un gran numero de etiquetas. He buscado un poco y encontre algo sobre  sgmllib pero no lo puedo importar en python 3 y me gustaria saber si alguien tiene conocimiento sobre esto.

Muchas gracias de antemano