我正在尝试制作一个脚本来总结包含以下短格式日志的文件。
日志片段:
$ cat input.txt
ffffff 1301 2012-08-29T03:13:33 clr crit
Some serious problem
cccc dddddd eeeeee
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
Some serious problem in system.
ffffff 1302 2012-08-29T03:13:33 set min
Some serious problem
cccc dddddd eeeeee
bbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
Some minor problem in system.
Run Code Online (Sandbox Code Playgroud)
期望的输出:
2012-08-29T03:13:33 clr crit Some serious problem in system.
2012-08-29T03:13:33 set min Some minor problem in system.
Run Code Online (Sandbox Code Playgroud)
我尝试了以下方法:
$ cat input.txt | grep -iE "set|upd|clr" | awk '{print $3,$4,$5}' >file1
12-08-29T03:13:33 clr crit
12-08-29T03:13:33 set min
Run Code Online (Sandbox Code Playgroud)
下面的命令给了我模式 "T" 的第 5 行,但问题在于所需的文本行,在某些情况下它在第 5 行,在某些情况下它在第 4 行。
$ awk '/T/ { show[NR+4]++ } show[NR]' input.txt >file2
$ paste file1 file2
Run Code Online (Sandbox Code Playgroud)
询问:
在某些情况下,它在第 5 行,在某些情况下,它在第 4 行。我怎样才能确保找到确切的文本。如果可能,请告诉我。
解决此问题的正确方法是将 awks Record Separator 设置为空字符串,以便 awk 知道您的输入记录由空行分隔:
$ awk -v RS= -F'\n' '{split($1,a,/ +/); print a[3],a[4],a[5],$NF}' file
2012-08-29T03:13:33 clr crit Some serious problem in system.
2012-08-29T03:13:33 set min Some minor problem in system.
Run Code Online (Sandbox Code Playgroud)
这样,如果/当您想要将来打印记录的其他部分或打印记录数的计数或仅打印基于某些关键字段或其他内容的唯一记录时,这绝对是微不足道的,因为 awk 知道并正在操作记录。
| 归档时间: |
|
| 查看次数: |
224 次 |
| 最近记录: |