html看起来像这样:
<p>
sometext1
<br>
sometext2
<br>
sometext3
</p>
Run Code Online (Sandbox Code Playgroud)
我想提取段落标记之间的所有文本,包括<br>
标记.
我试图使用storeText
函数,但它只存储文本,没有标签.我可以存储整个HTML源代码,然后在Perl中提取我需要的东西,但我想知道是否有办法使用特定的xpath存储HTML代码块(例如,在网页内存储第三个表的HTML代码一个变量).
归档时间: |
|
查看次数: |
14398 次 |
最近记录: |