正则表达式仅匹配行尾的X个字符

ŹV *_*V - 8 regex grep string-search

下面你将看到来自专有路由设备的32b内存转储中字符串'octeon'的一小段匹配.正如您所看到的,它包含一些调整后的ASCII,从行尾开始延伸到16个字符,然后是4个32位字(当然每个8个字符),然后是地址偏移量.

000b27a0: 41646a75 7374206f 6374656f 6e5f6970    Adjust octeon_ip
000b2850: 73740a00 00000000 6f637465 6f6e5f72    st......octeon_r
000b2870: 5f73697a 65000000 6f637465 6f6e5f72    _size...octeon_r
000b2990: 6164696e 672e0a00 6f637465 6f6e5f72    ading...octeon_r
000b29b0: 785f7369 7a650000 6f637465 6f6e5f72    x_size..octeon_r
000b3050: 780a0000 00000000 6f637465 6f6e5f70    x.......octeon_p
000b3650: 6564204f 6374656f 6e206d6f 64656c0a    ed Octeon model.
000bade0: 20307825 71780a00 6f637465 6f6e5f6c     0x%qx..octeon_l
000bafd0: 696e6720 4f637465 6f6e2045 78656375    ing Octeon Execu
000bd710: 6564204f 6374656f 6e204d6f 64656c21    ed Octeon Model!
000bd950: 4f435445 4f4e2070 61737320 3120646f    OCTEON pass 1 do
000bda20: 6564206f 6374656f 6e206d6f 64656c3a    ed octeon model:
Run Code Online (Sandbox Code Playgroud)

虽然这些数据包含一些有用的信息,但不幸的是,操作系统(HiveOS)没有尝试连续分配内存或者合并不同的堆(为什么它们呢?),所以绝大多数内存都是贫瘠的未来-malloc'd堆.

0004d6b0: 00000000 00000000 00000000 00000000    ................
0004d6c0: 00000000 00000000 00000000 00000000    ................
0004d6d0: 00000000 00000000 00000000 00000000    ................
0004d6e0: 00000000 00000000 00000000 00000000    ................
0004d6f0: 00000000 00000000 00000000 00000000    ................
0004d700: 00000000 00000000 00000000 00000000    ................
0004d710: 00000000 00000000 00000000 00000000    ................
0004d720: 00000000 00000000 00000000 00000000    ................
0004d730: 00000000 00000000 00000000 00000000    ................
0004d740: 00000000 00000000 00000000 00000000    ................
0004d750: 00000000 00000000 00000000 00000000    ................
Run Code Online (Sandbox Code Playgroud)

我想快速有效地拉出一定大小的字符串,匹配一些任意正则表达式模式([a-zA-z]想到)你可能会自然地认为运行常年对象转储检查最喜欢的'字符串'会产生结果,但是mdutil是一个残忍的情妇 - 由于存在ascii编码的十六进制存储体和地址,它将每一行标识为包含"字符串".

当然,我们都知道存在一个简单的脚本解决方案(for line in hexdump: f.write(line[-16:])+ grep '[A-z]' f).

然而,有时我会感到震惊的是,我应该更好地理解这些卑鄙的压迫性但却误解的正则表达式,而不是回到我易于使用的新奇的程序语言.在我用各种流编辑器和Awk脚本的正则表达式完全取代整个开发工具链之前,我真的觉得我无法开始成长真正的Unix领带.

如何[a-zA-z]在行尾的一定数量的字符内匹配(在我的情况下,16) - 它看起来像一个非常精悍的结构,但+,?的所有组合?{16}以及在过去几分钟对我有意义的其他情况很快就失败了.

Boh*_*ian 6

使用"不匹配"开关-v:

grep -v \.{16}$
Run Code Online (Sandbox Code Playgroud)

这将删除所有以16个点结尾的行.

这是man它的文档:

-v, - inverse-match
反转匹配感,选择不匹配的行.