如果您熟悉jQuery,可能需要查看pQuery,这使得这非常简单:
## print every <h2> tag in page
use pQuery;
pQuery("http://google.com/search?q=pquery")
->find("h2")
->each(sub {
my $i = shift;
print $i + 1, ") ", pQuery($_)->text, "\n";
});
Run Code Online (Sandbox Code Playgroud)
还有HTML :: DOM.
但是,无论你做什么,都不要使用正则表达式.