使用awk(或sed)根据下一行的第一个字符删除换行符

Question

使用awk(或sed)根据下一行的第一个字符删除换行符

这是我的情况:我有一个大文本文件,我想从中提取某些信息.我使用sed根据regexp提取所有相关信息,但我提取的每一条"信息"都在一个单独的行上,我希望每个"记录"都在它自己的行上,这样它就可以很容易地导入到一个DB.
这是我现在的数据样本:

92831,499,000
,0644321
79217,999,000
,5417178
,PK91622
,PK90755

理想情况下,我希望此输出看起来像:

92831,499,000,0644321
79217,999,000,5417178,PK91622
79217,999,000,5417178,PK90755

这可能更难做,所以我会满足于最后一个"记录"的输出只出现一次,附加的"PK ......"成为该行的第4个"字段".
最后,我能想到的最简单的方法是,如果该行以逗号(^,)开头,那么新行应该删除之前......我不太熟悉awk但是如果你能给我一个从这开始它真的很感激!谢谢!

Answer 1

Dem*_*nex 6

$ perl -0pe 's/\n,/,/g' < test.dat
92831,499,000,0644321
79217,999,000,5417178,PK91622,PK90755

翻译:在没有行分隔的情况下批量阅读,只用逗号换掉换行后的每个逗号.

这里最短的代码!

Answer 2

Mik*_*ike 2

好吧，我想当我昨晚试图解决这个问题时，我应该仔细研究一下在 awk 中使用 Records 的情况……在查看它们 10 分钟后，我就开始工作了。对于任何感兴趣的人，我都是这样做的：在我原来的 sed 脚本中，我在每条记录的开头前面放置了一个额外的换行符，因此现在有一个空行分隔每条记录。然后我使用以下 awk 命令：

awk 'BEGIN {RS = ""; FS = "\n"}
{
if (NF >= 3)
for (i = 3; i <= NF; i++)
打印 $1,$2,$i
}'

它就像一个魅力，完全按照我想要的方式输出！

归档时间：	15 年，12 月前
查看次数：	5754 次
最近记录：	14 年，2 月前