小编nic*_*ick的帖子

如何从Perl中的HTML表中提取数据?

可能重复:
您能提供一个用您喜欢的解析器解析HTML的示例吗?
如何使用Perl从HTML文件中提取内容?


我正在尝试在Perl中使用正则表达式来解析具有以下结构的表.第一行如下:

<tr class="Highlight"><td>Time Played</a></td><td></td><td>Artist</td><td width="1%"></td><td>Title</td><td>Label</td></tr>
Run Code Online (Sandbox Code Playgroud)

在这里,我希望取出"Time Played","Artist","Title"和"Label",并将它们打印到输出文件中.

任何帮助都会受到极大的折磨!

对不起......我尝试了很多正则表达式,例如:

$lines =~ / (<td>) /
       OR
$lines =~ / <td>(.*)< /
       OR
$lines =~ / >(.*)< /
Run Code Online (Sandbox Code Playgroud)

我当前的程序看起来像这样:

#!perl -w

open INPUT_FILE, "<", "FIRST_LINE_OF_OUTPUT.txt" or die $!;

open OUTPUT_FILE, ">>", "PLAYLIST_TABLE.txt" or die $!;

my $lines = join '', <INPUT_FILE>;

print "Hello 2\n";

if ($lines =~ / (\S.*\S) /) {
print "this is 1: \n";
print $1;
    if ($lines =~ / <td>(.*)< / ) {
    print "this is …
Run Code Online (Sandbox Code Playgroud)

html perl parsing

5
推荐指数
2
解决办法
2万
查看次数

标签 统计

html ×1

parsing ×1

perl ×1