Administrare server open source

Platforma de hosting cu software liber, gratuit, open source.

Comentariile sunt închise pentru Preluarea listei de linkuri dintr-o pagina web

Cum Perl a fost conceput pentru prelucrarea si extragerea de informatii din texte, nu e de mirare ca detine metode simple pentru taskuri care in alte limbaje consuma cateva zeci de linii de cod. Unul din taskurile utile oferite de Perl este citirea automata a linkurilor dintr-o pagina web, treaba care se poate face foarte usor folosind libraria WWW::Mechanize.

#!/usr/bin/perl
use WWW::Mechanize;
 
my $url = 'http://www.lamp.ro';
my $mech  = WWW::Mechanize->new();
$mech->get( $url );
 
my @links = $mech->links();
 
foreach my $link (@links) {
        print $link->url()."\n";
}

Dupa cum se poate observa in codul de mai sus, in mai putin de 10 linii am extras toate linkurile dintr-o pagina web si le-am prelucrat – in cazul nostru, le-am afisat pe ecran. De aici pana la crearea unui crawler sau la un sistem de monitorizare a unei liste de linkuri nu mai e cale lunga, decat de cateva linii de cod si putina imaginatie.

Perl

Comments are closed.