SoloCodigo

Programación Web y Scripting => HTML => Mensaje iniciado por: BLADDE en Martes 5 de Febrero de 2008, 04:12

Título: Sacar Informacion De Un Html
Publicado por: BLADDE en Martes 5 de Febrero de 2008, 04:12
que tal amigos espero este todo bien.
veran lo q se me presenta es lo siguiente hay una pagina(html) que tiene una tabla q me interesa mostrar en una pagina html mi idea es sacar de esa pagina la informacion necesaria para reproducir solo esa tabla con la informacion.
me meti en la pagina y le di en ver codigo fuente y determine en q parte de ese html esta la informacion que necesito la corte y la pegue en un html nuevo y me mostro la informacion q quiero pense en hacer un programa que se mueva hasta donde esta la informacion que quiero la pase a otro archivo y este sea el q se muestra pero para eso necesito saber como bajarme ese html y poder hacerle ese tratamiento, por otra parte pense en si se podia de forma directa entrar y sacar la info quiero.

aclaro   pagina1.html    ----->pasar la informacion a ------>pagina2.html
Título: Re: Sacar Informacion De Un Html
Publicado por: x.cyclop en Martes 5 de Febrero de 2008, 04:33
Si usas Firefox, la extensión Web Developer te puede servir.

Ahora, para pasar de 1-2... ¿quiéres hacer una especie de formulario? No entendí bien. :D
Título: Re: Sacar Informacion De Un Html
Publicado por: BLADDE en Martes 5 de Febrero de 2008, 05:29
pues veras la pagina uno tiene una tabla que la muestran y cambia constantemente pues bien yo lo que quiero es q mi html se meta en esa pagina y saque la informacion necesaria para yo dar esa informacion tambien y tu te preguntaras por q no poner el vinculo y ya pues es q el vinculo muestra muchas cosas de la otra pagina yo solo quiero la informacion que esta en la tabla
como les digo yo me meti en el codigo de la pagina y logra cortar la parte q me interesa  pero no quiero estar cortando y pegando (actualizando mi pagina) todo el tiempo sino q lo haga el solo
espero me entiendas :)
Título: Re: Sacar Informacion De Un Html
Publicado por: F_Tanori en Martes 5 de Febrero de 2008, 09:43
no puedes solicitar la informacion o un medio de acceso  al dueño de la pagina?
no puedes obtener la informacion de un canal RSS o algo por el estilo?
no puedes usar PHP o alguno otro lenguaje ?

Saludos
Título: Re: Sacar Informacion De Un Html
Publicado por: Altareum en Martes 5 de Febrero de 2008, 14:21
Puedes cortarlo usando php, o asp... o jsp o ruby.. etc... El problema está en que si en algún momento, modifican la estructura de la página, ya no te servirá dicho script, deberías estar muy atento.
O mejor, como te dijo Tanori, ver si no tienen un rss o bien hablar con el dueño de la web, para ver si puede brindarte dicha información.


Altareum.
Título: Re: Sacar Informacion De Un Html
Publicado por: BLADDE en Martes 5 de Febrero de 2008, 17:42
compañeros gracias por contestar pues veran por rss no puedo , lograr que el dueño de la pagina me facilite el contenido me dijo que no podia por q el maneja ese portal atraves de joomla y quien llena la informacion que requiero es otra persona
solo les pregunto en php yo puedo tratar el archivo html como uno trata un txt cuando hace trabajo sobre archivos?? es decir me voy moviendo de linea en linea y ya?? de ser asi me pueden decir como obterner el archivo html completo para poder darle el tratamiento o como? sin necesidad de descargarlo obtenerla.

buscando por ahi encontre esto
url="http://steamcommunity.com/id/vancete/stats/TF2";
$ch = curl_init();

curl_setopt ($ch, CURLOPT_URL,$url);
curl_setopt ($ch, CURLOPT_HEADER, 0);
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
$page = trim(curl_exec($ch));


$pos1=strpos($page,"Accumulated Points:");
$pos1=strpos($page,'whiteText">',$pos1);
$pos1=$pos1+11;

$pos2=strpos($page,"</span>",$pos1);

$puntuacion=substr($page,$pos1,$pos2-$pos1);
echo "puntuacion :".$puntuacion;

pregunto curl es un programa aparte de php o lo puedo usar sin problema=?
Título: Re: Sacar Informacion De Un Html
Publicado por: BLADDE en Martes 5 de Febrero de 2008, 18:01
amigos ya lei sobre curl voy a probar con el a si esta en php :)=
Título: Re: Sacar Informacion De Un Html
Publicado por: su - en Martes 5 de Febrero de 2008, 21:46
No es mayor cosa cuando sabes como es la pagina, con un HTML parse se hace facilmente, ya sea con PHP o cualquier otro.

Busca una libreria para extraer tablas.
Título: Re: Sacar Informacion De Un Html
Publicado por: RadicalEd en Miércoles 6 de Febrero de 2008, 13:18
Utiliza expresiones regulares para sacar la info de la página, en el blog del foro hay una miniaplicación desarrollada en Python que toma los datos de una Web y los mete en una variable, lo que puedes hacer después es imprimir esos datos o guardarlos.

Checa acá (http://www.solocodigo.com/blogs/?p=567)
Título: Re: Sacar Informacion De Un Html
Publicado por: burke en Lunes 18 de Febrero de 2008, 16:04
no se si eso te va a servir para mucho