Ren*_*nga 3 awk text-processing regular-expression
我尝试通过以下命令根据过滤条件提取数据awk,但它不起作用。你能解决这个问题吗?
awk -v RS='' -v ORS='\n\n' '/func: peak*down*HIL/' filename
Run Code Online (Sandbox Code Playgroud)
输入:
func: peak_rec_head_HIL
sub: xyz
value: adc
log:path
close:date
func: peak_some_down_head_HIL
sub: xyz
value: adc
log:path
close:date
func: peak_another_one_down_head_HIL
sub: xyz
value: adc
log:path
close:date
func: peak_rec_head_HIL
sub: xyz
value: adc
log:path
close:date
func: peak_another_one_down_head_joy_HIL
sub: xyz
value: adc
log:path
close:date
Run Code Online (Sandbox Code Playgroud)
预期输出:
func: peak_some_down_head_HIL
sub: xyz
value: adc
log:path
close:date
func: peak_another_one_down_head_HIL
sub: xyz
value: adc
log:path
close:date
func: peak_another_one_down_head_joy_HIL
sub: xyz
value: adc
log:path
close:date
Run Code Online (Sandbox Code Playgroud)
问题在于正则表达式。您需要将每个替换*为.*以匹配子字符串之间的任意数量的任意字符。
awk -v RS='' -v ORS='\n\n' '/func: peak.*down.*HIL/' file
Run Code Online (Sandbox Code Playgroud)
每个都*修改表达式前一部分的行为,允许其匹配零次或多次。该表达式peak*down将匹配peadown、peakdown、peakkdown等中的任何一个peakkkdown。
由于文件的格式与GNU reutils使用的相同,我个人会使用recsel而不是awk查询(或通常使用)您的数据:
recsel -e 'func ~ "peak.*down.*HIL"' file
Run Code Online (Sandbox Code Playgroud)
使用了解数据格式的工具通常比通用文本处理工具更好(更容易、更强大、更容易维护)。