在linux中是否有一种简单的方法可以从命令行中删除文本网站?

Dan*_*Dan 6 html linux bash parsing

我一直在寻找一个命令行工具,它可以将html代码转换为网站上显示的文本......所以它等同于在Web浏览器中选择所有内容然后将其粘贴到文本编辑器中. .

任何人都知道Ubuntu会做这件事吗?我正在尝试编写一个脚本来解析一些网页,但是我不想处理HTML,而只是想解析网站上出现的文本.

谢谢,

Ign*_*ams 12

lynx -dump http://example.com/
Run Code Online (Sandbox Code Playgroud)


Joh*_*ker 7

如果你已经有html文件:

lynx -dump file.html > file.txt
Run Code Online (Sandbox Code Playgroud)

否则使用@ Ignacio's