标签: mojo-dom

用" "替换任何标签内容中的所有空格

任务

替换任何标记内容中的所有空格 .

y.html(示例文件)

<p class=MsoNormal style='margin-top:1.0pt;margin-right:0cm;margin-bottom:1.0pt;
margin-left:34.0pt;text-indent:-19.8pt'><span lang=NL-BE style='font-size:10.0pt;
font-family:Symbol;color:black;mso-ansi-language:NL-BE'>·</span><span
class=GramE><span style='font-size:7.0pt;color:black'>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
</span><span style='font-size:10.0pt;font-family:Arial;color:black'>Kit</span></span><span
style='font-size:10.0pt;font-family:Arial;color:black'> </span><span
class=SpellE><i><span style='font-size:10.0pt;font-family:Arial'>Strongyloides</span></i></span><i><span
style='font-size:10.0pt;font-family:Arial'> <span class=SpellE>ratti</span></span></i><span
style='font-size:10.0pt;font-family:Arial'> (nr. 9450) van <span class=SpellE>Bordier</span>
Affinity Products. </span><span lang=NL-BE style='font-size:10.0pt;font-family:
Arial;mso-ansi-language:NL-BE'>Zie bijsluiter in bijlage: CLKB_B_0306. Te
bewaren bij 2 – 8 °C tot vervaldatum.</span><span lang=NL-BE style='mso-ansi-language:
NL-BE'><o:p></o:p></span></p>
Run Code Online (Sandbox Code Playgroud)

我尝试了什么

#!/usr/bin/perl
use strict;
use warnings;
use Mojo::DOM;
open (my $fh, "<", "y.html") or die $!;
my $dom = Mojo::DOM->new(do{local $/ = undef; <$fh>});
$dom->find("*")->each( sub { $_->content( …
Run Code Online (Sandbox Code Playgroud)

perl mojo-dom

5
推荐指数
1
解决办法
727
查看次数

标题后使用Mojo :: DOM提取未标记的文本

我正在尝试使用Mojo :: DOM从HTML文件中提取一些没有标签的文本(这是我的新手)。特别是,H2标题(文件中还有其他标题)之后的描述文本。

<h2>Description</h2>This text is the description<div class="footer">[<a href="/contrib/rev/1597/2795/">Edit description</a>
Run Code Online (Sandbox Code Playgroud)

我已经能够找到标题,但是之后不知道如何访问文本,因为我没有标签来跳转到...

my $dom = Mojo::DOM->new( $htmlfile );
my $desc = $dom
    ->find('h2')
    ->grep(sub { $_->all_text =~ /Description/ })
    ->first;
Run Code Online (Sandbox Code Playgroud)

谁能向我推荐一种方法来获取“此文字为描述”字符串?

perl mojo-dom

3
推荐指数
1
解决办法
60
查看次数

标签 统计

mojo-dom ×2

perl ×2