小编Cod*_*son的帖子

使用grep从本地文件中的HTML标记内部获取文本

可能重复:
RegEx匹配除XHTML自包含标记之外的开放标记

摘自输入文件

<TD class="clsTDLabelWeb" width="28%">Municipality:&nbsp;</TD>
<TD style="WIDTH: 394px" class="clsTDLabelSm" colSpan="5">
<span id="DInfo1_Municipality">JUPITER</span></TD>
Run Code Online (Sandbox Code Playgroud)

我的正则表达

(?<=<span id="DInfo1_Municipality">)([^</span>]*)
Run Code Online (Sandbox Code Playgroud)

我有一个HTML文件保存到磁盘.我想使用grep搜索文件并输出特定范围的内容,但我不知道这是否正确使用grep.当我在文件上运行grep时,表达式从另一个文件读取(所以我不会弄乱任何特殊字符),它不会输出任何内容.我在RegExr中测试了表达式,它匹配"JUPITER",这正是我想要的返回.非常感谢你的帮助!

期望的输出

JUPITER
Run Code Online (Sandbox Code Playgroud)

html regex bash grep screen-scraping

6
推荐指数
1
解决办法
1万
查看次数

标签 统计

bash ×1

grep ×1

html ×1

regex ×1

screen-scraping ×1