使用awk解析空间分隔的文本文件

San*_*lai 0 awk gawk

有人可以帮我使用awk进行解析吗?
对不起,我没有任何代码我的输入空格分隔文本文件(该文件在项目行中还有一些字段)

category is fruits


item id  8837878
item id  8837879
item id  8837880
item id  8837881
item id  8837882
item id  8837883
item id  8837884
item id  8837885
item id  8837886
item id  8837887
item id  8837888
item id  8837889


category is veg

item id  8837890
item id  8837891
item id  8837892
item id  8837893
item id  8837894
item id  8837895
item id  8837896
item id  8837897
Run Code Online (Sandbox Code Playgroud)

必需的制表符分隔输出文件

fruits item id  8837878
fruits item id  8837879
fruits item id  8837880
fruits item id  8837881
fruits item id  8837882
fruits item id  8837883
fruits item id  8837884
fruits item id  8837885
fruits item id  8837886
fruits item id  8837887
fruits item id  8837888
fruits item id  8837889
veg item id  8837890
veg item id  8837891
veg item id  8837892
.....
Run Code Online (Sandbox Code Playgroud)

Chr*_*our 5

一种方式awk:

$ awk '/^category/{c=$3}/^item/{print c,$0}' file
fruits item id  8837878
fruits item id  8837879
fruits item id  8837880
fruits item id  8837881
fruits item id  8837882
fruits item id  8837883
fruits item id  8837884
fruits item id  8837885
fruits item id  8837886
fruits item id  8837887
fruits item id  8837888
fruits item id  8837889
veg item id  8837890
veg item id  8837891
veg item id  8837892
veg item id  8837893
veg item id  8837894
veg item id  8837895
veg item id  8837896
veg item id  8837897
Run Code Online (Sandbox Code Playgroud)

要根据您的需要格式化输出,您可以使用printf:

$ awk '/^category/{c=$3}/^item/{printf "%s %s %s %d\n",c,$1,$2,$3}' file
Run Code Online (Sandbox Code Playgroud)

因此,通过制表符分隔输出可能意味着:

$ awk '/^category/{c=$3}/^item/{printf "%s %s %s\t%d\n",c,$1,$2,$3}' file
Run Code Online (Sandbox Code Playgroud)