我想<tr> </tr>
从 html 文档中检索这两个标签之间的任何内容。现在我没有任何特定的 html 要求可以保证 html 解析器。我只是需要一些匹配的东西,<tr>
并</tr>
在两者之间获取所有东西,并且可能有多个tr
s。我试过 awk,它有效,但由于某种原因,它最终给了我提取的每一行的副本。
awk '
/<TR/{p=1; s=$0}
p && /<\/TR>/{print $0 FS s; s=""; p=0}
p' htmlfile> newfile
Run Code Online (Sandbox Code Playgroud)
如何解决这个问题?