我需要匹配所有这些开始标记:
<p>
<a href="foo">
Run Code Online (Sandbox Code Playgroud)
但不是这些:
<br />
<hr class="foo" />
Run Code Online (Sandbox Code Playgroud)
我想出了这个,并希望确保我做对了.我只抓住了a-z.
<([a-z]+) *[^/]*?>
Run Code Online (Sandbox Code Playgroud)
我相信它说:
/,然后我有这个权利吗?更重要的是,你怎么看?
我是linux的初学者.你能帮我解决一下如何将html页面转换为文本文件的问题.文本文件将从网页中删除任何图像和链接.我想只使用bash命令,而不是html文本转换工具.作为一个例子,我想转换第一页谷歌搜索结果为"计算机".
谢谢