使用 wget 和 regex 进行数据抓取

Aad*_*oid 5 bash grep wget

我刚刚学习 bash 脚本,我试图从网站上抓取一些数据,主要是维基词典。这就是我现在在命令行上尝试的,但它没有返回任何结果

wget -qO- http://en.wiktionary.org/wiki/robust | egrep '<ol>{[a-zA-Z]*[0-9]*}*</ol>'
Run Code Online (Sandbox Code Playgroud)

我正在尝试的是获取标签之间的数据,只是希望它们被显示。你能帮我找出我做错了什么吗?

谢谢

Mic*_*jer 4

您需要将输出发送到标准输出:

wget -q http://en.wiktionary.org/wiki/robust -q -O - | ...
Run Code Online (Sandbox Code Playgroud)

<ol>使用 grep 获取所有标签,您可以执行以下操作:

wget -q http://en.wiktionary.org/wiki/robust -O - | tr '\n' ' ' | grep -o '<ol>.*</ol>'
Run Code Online (Sandbox Code Playgroud)