使用awk(或sed)根据下一行的第一个字符删除换行符

Mik*_*ike 8 bash shell awk sed

这是我的情况:我有一个大文本文件,我想从中提取某些信息.我使用sed根据regexp提取所有相关信息,但我提取的每一条"信息"都在一个单独的行上,我希望每个"记录"都在它自己的行上,这样它就可以很容易地导入到一个DB.
这是我现在的数据样本:

92831,499,000
,0644321
79217,999,000
,5417178
,PK91622
,PK90755

理想情况下,我希望此输出看起来像:

92831,499,000,0644321
79217,999,000,5417178,PK91622
79217,999,000,5417178,PK90755

这可能更难做,所以我会满足于最后一个"记录"的输出只出现一次,附加的"PK ......"成为该行的第4个"字段".
最后,我能想到的最简单的方法是,如果该行以逗号(^,)开头,那么新行应该删除之前......我不太熟悉awk但是如果你能给我一个从这开始它真的很感激!谢谢!

Dem*_*nex 6

$ perl -0pe 's/\n,/,/g' < test.dat
92831,499,000,0644321
79217,999,000,5417178,PK91622,PK90755

翻译:在没有行分隔的情况下批量阅读,只用逗号换掉换行后的每个逗号.

这里最短的代码!


Mik*_*ike 2

好吧,我想当我昨晚试图解决这个问题时,我应该仔细研究一下在 awk 中使用 Records 的情况……在查看它们 10 分钟后,我就开始工作了。对于任何感兴趣的人,我都是这样做的:在我原来的 sed 脚本中,我在每条记录的开头前面放置了一个额外的换行符,因此现在有一个空行分隔每条记录。然后我使用以下 awk 命令:

awk 'BEGIN {RS = ""; FS = "\n"}
{
if (NF >= 3)
for (i = 3; i <= NF; i++)
打印 $1,$2,$i
}'

它就像一个魅力,完全按照我想要的方式输出!