从文件中的特定行以相反的顺序 grep 文件

Bin*_*ler 2 bash perl awk grep sed

我有这种日志

2019-11-14T20:03:48.917Z  INFO Thread1 Audit ... Operation status="success" ... id=dad69655-07d0-4daf-a639-b8e3257fa6bd msg...
2019-11-14T20:03:48.908Z  INFO Thread Audit Operation status="success" ... id=67ab8c3b-b57c-4328-b483-81582be0341d msg...
2019-11-14T20:03:48.909Z  INFO Thread Audit ... Operation status="success" ...  id=b0485887-004a-4f55-b287-f5c9cf609787 msg...
2019-11-14T20:03:48.911Z  INFO Thread2 Audit ... Operation status="success" ... id=35ca8c14-757f-474a-a929-494781c4679f msg...
2019-11-14T20:03:48.915Z  INFO Thread2 Audit ... Operation status="failure" ... id=72f73c66-da37-11e9-8d68-005056bce6a5 msg...
2019-11-14T20:03:48.917Z  INFO Thread1 Audit ... Operation status="success" ... id=26ece804-da3a-11e9-bfed-005056bce25b msg...
2019-11-14T20:03:48.919Z  INFO Thread Not ... Operation status="failure" ... id=1b31f53f-66d5-475f-ace3-ed1905e8f818 msg...
2019-11-14T20:03:48.921Z  INFO Thread Not ... Operation status="success" ... id=84ee4947-633f-4ccb-832e-7b380052401c msg...
2019-11-14T20:03:48.948Z  INFO Thread Audit ... Operation status="failure" ... id=26ece804-da3a-11e9-bfed-005056bce25b msg...
2019-11-14T20:03:48.950Z  INFO Thread Audit ... Operation status="success" ... id=8837cb5f-48f5-49db-8ade-a47b96527501 msg...
Run Code Online (Sandbox Code Playgroud)

...意味着在这之间可以有任何东西,...有时也可以是单个空格。

msg...意味着 id 并不总是在行尾,msg...有时也可以为空。

实际上它很复杂,但基本结构是这样的。

输入- 我的输入是给定的 id。

Condition - 条件是查看包含此 id 的日志行,其 OPstatus 为失败并且它属于审计类。

找到此日志行后,拿起它的线程并获取属于该线程的所有日志,直到该线程的先前审核日志。

因此,输入是给定的日志行和一个 id = 26ece804-da3a-11e9-bfed-005056bce25b

我期待的输出是这个

2019-11-14T20:03:48.909Z  INFO Thread Audit ... Operation status="success" ...  id=b0485887-004a-4f55-b287-f5c9cf609787
2019-11-14T20:03:48.919Z  INFO Thread Not ... Operation status="failure" ... id=1b31f53f-66d5-475f-ace3-ed1905e8f818 msg...
2019-11-14T20:03:48.921Z  INFO Thread Not ... Operation status="success" ... id=84ee4947-633f-4ccb-832e-7b380052401c msg...
2019-11-14T20:03:48.948Z  INFO Thread Audit ... Operation status="failure" ... id=26ece804-da3a-11e9-bfed-005056bce25b msg...
Run Code Online (Sandbox Code Playgroud)

我试过的是这个 -

awk '{if($0~/.*Audit.*26ece804-da3a-11e9-bfed-005056bce25b.*/) system("grep -w " $3 " " FILENAME "| sed \"0,/.*Audit.*Operation status="success".*/d\" | sed \"/Operation status="failure"/{n;d;}\"" )}' file.log
Run Code Online (Sandbox Code Playgroud)

请帮忙!

cho*_*oba 5

Perl 来救援!

perl -lane 'push @{ $h{ $F[2] } }, $_;
     if ("Audit" eq $F[3]) {
         print join "\n", "", @{ $h{ $F[2] } } if /status="failure"/;
         splice @{ $h{ $F[2] } }, 0, -1;
     }' -- file.log
Run Code Online (Sandbox Code Playgroud)
  • -n 逐行读取输入
  • -l 从输入中删除换行符并将它们添加回输出
  • -a将空格上的输入拆分为@F数组
  • 每一行都存储到一个以线程名称为键的散列中(第三列,即$F[2]
  • 如果第四列$F[3]Audit并且该行包含失败通知,我们将打印所有先前记录的同一线程的审计行
  • 向哈希添加新的审计行时,我们删除所有以前的审计行(参见splice

换句话说,我们存储每个线程名称的所有审计行,并为每个失败的审计打印以前的行。