Grep表示以特定字符结尾的字符串

Question

Grep表示以特定字符结尾的字符串

有没有办法使用扩展正则表达式来查找以字符串结尾的特定模式.

我的意思是,我希望匹配前3行但不是最后一行:

file_number_one.pdf # comment
file_number_two.pdf # not interesting
testfile_number____three.pdf # some other stuff
myfilezipped.pdf.zip some comments and explanations

Run Code Online (Sandbox Code Playgroud)

我知道在grep中,metacharacter $匹配一行的结尾,但我对匹配一个行结尾但字符串结束不感兴趣.grep中的组很奇怪,我还不太了解它们.

我试过组匹配,实际上我有一个类似的REGEX但它不适用于grep -E

(\w+).pdf$

Run Code Online (Sandbox Code Playgroud)

有没有办法在grep/egrep中进行字符串结束匹配？

Answer 1

Vol*_*gel 7

您的示例适用于匹配字符串后的空格:

grep -E '\.pdf ' input.txt

Run Code Online (Sandbox Code Playgroud)

你所谓的"字符串"类似于grep所谓的"字".Word是一组字母数字字符.单词的好处是你可以将单词结尾与特殊\>匹配,将单词结尾与零字符长度的行进匹配.这也匹配在行尾.但是字符这个词不能改变,并且不包含标点符号,所以我们不能使用它.

如果你需要在行尾匹配,在单词后面没有空格,请使用:

grep -E '\.pdf |\.pdf$' input.txt

Run Code Online (Sandbox Code Playgroud)

要包含文件名后面的字符不是空格字符' ', but other whitespace, like a tab, \t)或名称后面紧跟注释的情况#,请使用:

grep -E '\.pdf[[:space:]#]|\.pdf$' input.txt

Run Code Online (Sandbox Code Playgroud)

我将说明单词boundarys的匹配,因为这将是完美的解决方案,除了我们不能在这里使用它,因为我们不能改变被视为单词的一部分的字符集.

输入包含foo单独的单词,作为较长单词的一部分,其中不在单词foo的末尾,因此不在单词边界:

$ printf 'foo bar\nfoo.bar\nfoobar\nfoo_bar\nfoo\n'
foo bar
foo.bar
foobar
foo_bar
foo

Run Code Online (Sandbox Code Playgroud)

现在,为了匹配单词的边界,我们可以使用\<开头,并\>匹配结束:

$ printf 'foo bar\nfoo.bar\nfoobar\nfoo_bar\nfoo\n' | grep 'foo\>'
foo bar
foo.bar
foo

Run Code Online (Sandbox Code Playgroud)

注意如何_匹配单词char - 但除此之外,wordchars只是字母数字,[a-zA-Z0-9].
还要注意foo行尾是如何匹配的 - 仅包含行foo.我们不需要为行尾提供特殊情况.

Answer 2

cel*_*tas 5

您需要在正则表达式中转义.。此正则表达式将匹配以 .pdf 结尾的任何内容（并且仅匹配以 .pdf 结尾的内容）：

grep '.*\.pdf$' filename

Run Code Online (Sandbox Code Playgroud)

归档时间：	11 年，3 月前
查看次数：	16715 次
最近记录：	11 年，3 月前