正则表达式与预期数据不匹配

Ren*_*nga 3 awk text-processing regular-expression

我尝试通过以下命令根据过滤条件提取数据awk,但它不起作用。你能解决这个问题吗?

awk -v RS='' -v ORS='\n\n' '/func: peak*down*HIL/' filename
Run Code Online (Sandbox Code Playgroud)

输入:

func: peak_rec_head_HIL
sub: xyz
value: adc
log:path
close:date

func: peak_some_down_head_HIL
sub: xyz
value: adc
log:path
close:date

func: peak_another_one_down_head_HIL
sub: xyz
value: adc
log:path
close:date

func: peak_rec_head_HIL
sub: xyz
value: adc
log:path
close:date

func: peak_another_one_down_head_joy_HIL
sub: xyz
value: adc
log:path
close:date
Run Code Online (Sandbox Code Playgroud)

预期输出:

func: peak_some_down_head_HIL
sub: xyz
value: adc
log:path
close:date

func: peak_another_one_down_head_HIL
sub: xyz
value: adc
log:path
close:date

func: peak_another_one_down_head_joy_HIL
sub: xyz
value: adc
log:path
close:date
Run Code Online (Sandbox Code Playgroud)

Kus*_*nda 6

问题在于正则表达式。您需要将每个替换*.*以匹配子字符串之间的任意数量的任意字符。

awk -v RS='' -v ORS='\n\n' '/func: peak.*down.*HIL/' file
Run Code Online (Sandbox Code Playgroud)

每个都*修改表达式前一部分的行为,允许其匹配零次或多次。该表达式peak*down将匹配peadownpeakdownpeakkdown等中的任何一个peakkkdown

由于文件的格式与GNU reutils使用的相同,我个人会使用recsel而不是awk查询(或通常使用)您的数据:

recsel -e 'func ~ "peak.*down.*HIL"' file
Run Code Online (Sandbox Code Playgroud)

使用了解数据格式的工具通常比通用文本处理工具更好(更容易、更强大、更容易维护)。