bash regex 从文件中查找并保存字符串

Question

我的文件，hi.html有很多行文本。我需要追捕以

Hello abc123 blah blah blah

然后保存到myvariable任何文本所在的位置，abc123它的位置会不时改变，但是Hello是硬编码的，并且永远是“你好”。请注意，空格分隔由 all important 占据的文本的两侧abc123。

Answer 1

首先，强制性警告。尝试使用正则表达式等简单工具解析 HTML通常是一个非常糟糕的主意。也就是说，在这种情况下，如果您确定您想要的始终是以开头的行中的第二个单词Hello，您可以使用以下方法之一：

使用这两种方法，要将输出保存在变量中，请使用命令替换：

myvariable=$(grep -oP '^Hello\s+\K\S+')
myvariable=$(awk '/^Hello/{print $2}' file)

Answer 2

如果你grep支持PCRE，你可以这样做：

grep -Po '^Hello \K[^ ]+(?= )' hi.html

要将其保存在变量中：

myvariable="$(grep -Po '^Hello \K[^ ]+(?= )' hi.html)"

替代sed方式：

sed -n 's/^Hello \([^ ]\+\) .*/\1/p' hi.html

要将其保存在myvariable：

myvariable="$(sed -n 's/^Hello \([^ ]\+\) .*/\1/p' hi.html)"

请注意，使用正则表达式解析 html 可能不是一个好主意。