Mag*_* IB 5 regex quotes awk sed
我有一个(空格分隔的)输入文件,其中包含以下行:
field1=value1 field2="value 2" field3='value 3' field4="value '4'" ...
Run Code Online (Sandbox Code Playgroud)
字段数因行而异。为了正确处理这样的文件,我最好喜欢sed它并获得一些表格分隔的输出,例如:
field1 (tab) value1 (tab) field2 (tab) value 2 (tab) field3 (tab) value 3 (tab) field4 (tab) value '4'
Run Code Online (Sandbox Code Playgroud)
到目前为止,我所做的最远的事情是诸如sed "s/\([a-z][a-z]*\)=\(['\"]\{0,1\}\)\(..*?\)\2/\t\1\t\3/g"但离解决我的问题太远了。我的困难是正确处理值的分隔符(引号)的缺失或存在。对于优雅(或着想geekness),我坚持sed,但也将考虑一个awk替代方案。
在此先感谢您的帮助,
编辑:我很震惊地说,但@Jotne 是对的。
echo "field1=value1 field2=\"value 2\" field3='value 3' field4=\"value '4'\"" | sed "s/\([a-z][a-z]*\)=\(\([^ ][^ ]*\)\|'\([^'][^']*\)'\|\"\([^\"][^\"]*\)\"\)/\1\t\3\4\5\t/g"
Run Code Online (Sandbox Code Playgroud)
不起作用: field1=value1 field2="value 2" field3='value 3' field4="value '4'"`
尽管以下(背后的想法是解析audit.log文件)有效:
root@XXX:~# tail -n 2 /var/log/audit/audit.log
type=CRED_DISP msg=audit(1570385821.075:670): pid=32605 uid=0 auid=0 ses=399 msg='op=PAM:setcred acct="root" exe="/usr/sbin/cron" hostname=? addr=? terminal=cron res=success'
type=USER_END msg=audit(1570385821.075:671): pid=32605 uid=0 auid=0 ses=399 msg='op=PAM:session_close acct="root" exe="/usr/sbin/cron" hostname=? addr=? terminal=cron res=success'
root@XXX:~# tail -n 2 /var/log/audit/audit.log | sed "s/\([a-z][a-z]*\)=\(\([^ ][^ ]*\)\|'\([^'][^']*\)'\|\"\([^\"][^\"]*\)\"\)/\1\t\3\4\5\t/g"
type CRED_DISP msg audit(1570385821.075:670): pid 32605 uid 0 auid 0 ses 399 msg op=PAM:setcred acct="root" exe="/usr/sbin/cron" hostname=? addr=? terminal=cron res=success
type USER_END msg audit(1570385821.075:671): pid 32605 uid 0 auid 0 ses 399 msg op=PAM:session_close acct="root" exe="/usr/sbin/cron" hostname=? addr=? terminal=cron res=success
Run Code Online (Sandbox Code Playgroud)
为什么?
这可能对你有用(GNU sed):
sed -E 's/ \<([^ =]+)=("[^"]*"|'\''[^'\'']*'\'')/\t\1\t\2/g;s/=/\t/' file
Run Code Online (Sandbox Code Playgroud)
第一个替换替换除=第一个字段之外的所有 's 和空格字段。第二次替换纠正了第一个替换。