Informática en general > Dudas informáticas
Como Hago Spam
su -:
Niem, no he tenido mucho tiempo pero hise este programa en perl que extrae de href=mailto:algo@algo... de x sitio que le pongas.
--- Código: Text ---#!/usr/bin/perl -wuse strict;use LWP::UserAgent;sub browser { my $url = shift; my @mails; my $browser = LWP::UserAgent->new; $browser->agent("solocodigoSpider/0.1"); my $req = HTTP::Request->new(GET => "$url"); $req->header('Accep' => 'text/html'); my $respuesta = $browser->request($req); if($respuesta->is_success) { my $pagina = $respuesta->decoded_content; $pagina =~ s/\</ /g; $pagina =~ s/\>/ /g; $pagina =~ s/\^M/ /g; $pagina =~ s/\// /g; $pagina =~ s/br/ /g; $pagina =~ s/tr/ /g; $pagina =~ s/td/ /g; my @todo = split / /, $pagina; foreach my $palabra (@todo) { if($palabra =~ /^href=\"mailto:(.*)$/){ $palabra =~ s/href=\"mailto://g; $palabra =~ s/\"//g; push @mails, $palabra; } } } else { die "Error: ", $respuesta->status_line, "\n"; } return @mails;}my @mail = browser("http://www.pagina_para_buscar.com");print "Mails: ", @mail, "\n"; :hola:
cluster:
gracias su como se corre eso, pobemos con esta pagina
su -:
ahorita hago la implementacio, es que este prgrama solo toma los mails de una sola pagina.
En el url escrives esto:
http://www.iana.org/root-whois/ar.htm
que es la pagina de text (no tiene nada de especial, solo la enconte en yahoo buscando @ .ar)
Neseita un interprete de Perl, si estas en Windows tienes que hacer esto:
Windows MSI para 95 98 y NT
Y esto: http://www.activestate.com/Products/ActivePerl/
Si estas en Unix nada.
Copia el codigo a tu editor preferido, lo guardas .pl y desde una terminal ejecutas
--- Código: Text ---perl nombre_de_archivo.pl O mucho mejor:
- Copia esto -
--- Código: Text ---#!/usr/bin/perl -wuse strict;use LWP::UserAgent;sub browser { my $url = shift; my @mails; my $browser = LWP::UserAgent->new; $browser->agent("solocodigoSpider/0.1"); my $req = HTTP::Request->new(GET => "$url"); $req->header('Accep' => 'text/html'); my $respuesta = $browser->request($req); if($respuesta->is_success) { my $pagina = $respuesta->decoded_content; $pagina =~ s/\</ /g; $pagina =~ s/\>/ /g; $pagina =~ s/\^M/ /g; $pagina =~ s/\// /g; $pagina =~ s/br/ /g; $pagina =~ s/tr/ /g; $pagina =~ s/td/ /g; my @todo = split / /, $pagina; foreach my $palabra (@todo) { if($palabra =~ /^href=\"mailto:(.*)$/){ $palabra =~ s/href=\"mailto://g; $palabra =~ s/\"//g; push @mails, $palabra; } } } else { die "Error: ", $respuesta->status_line, "\n"; } return @mails;}die "Como usar: perl encontrarmail.pl http://pagina.com" unless @ARGV my @mail = browser("$ARVG[0]");print "Mails: ", @mail, "\n";
su -:
OK, ahora devera cojer hasta los "mail at gmail dot com" :D
cluster:
su me salio esto
C:\>perl mailget.pl http://www.iana.org/root-whois/ar.htm
Use of uninitialized value in string at mailget.pl line 42
Error: 400 URL missing
ha y donde publicaste extractor de correos no descargar el archivo
a otra pregunta como es el comando para adicionar el bin de perl es que se me olvido en DOS le doy path c:\perl\bin pero solo me lo activa a esa ventana como es que se hace para que quede fijo. gracias
Navegación
[#] Página Siguiente
[*] Página Anterior
Ir a la versión completa