如何使用sed替换换行符(\n)？

Question

如何使用sed替换换行符(\n)？

如何\n使用sed命令替换换行符()？

我没试成功:

sed 's#\n# #g' file
sed 's#^$# #g' file

Run Code Online (Sandbox Code Playgroud)

我如何解决它？

Answer 1

dmc*_*kee 1640

使用sed呢？

tr '\n' ' ' < input_filename

Run Code Online (Sandbox Code Playgroud)

或完全删除换行符:

tr -d '\n' < input.txt > output.txt

Run Code Online (Sandbox Code Playgroud)

或者如果你有GNU版本(有很长的选项)

tr --delete '\n' < input.txt > output.txt

Run Code Online (Sandbox Code Playgroud)

sed在输入的"流"上工作,但它以换行符分隔的块来理解它.它是一个unix工具,这意味着它做得很好.一件事是"在文件行上工作".让它做其他事情会很难,而且冒险.故事的寓意是:选择合适的工具.你的很多问题似乎都采用了"我怎样才能让这个工具做一些从未打算过的事情？"的形式.这些问题很有意思,但如果他们在解决实际问题的过程中遇到问题,那么你可能做错了. (185认同)
Sed是基于行的,因此很难掌握换行符. (87认同)
tr很棒,但你只能用单个字符替换换行符.如果要使用字符串替换换行符,则需要使用其他工具 (68认同)
@Eddy - 我用tr替换了一个没有出现在文本中的字符的新行(我使用了反引号),然后sed用我想要使用的字符串替换反引号 (20认同)
`tr` 仅适用于一个字符串。您无法将所有新行替换为多个字符长的字符串。 (7认同)
@JBBrown`tr`是一种经常被忽视的宝石,用于建造管道. (5认同)
@elgalu - 这很可能是因为作为字符的颜色会干扰您的搜索/替换模式.在需要时,我使用以下别名来删除流中的颜色:`alias noc ='sed -r"s /\x1B\[([0-9] {1,2}(; [0-9] {1 ,2}))？[M | K] //克"'` (5认同)
这个答案非常有助于我将一个(日志)文件的三个连续行组合成一个,通过以下过程:grep --after-context 3(pattern)(file)| tr'\n'''| sed -e's/ - /\n/g'. (4认同)
作为旁注,` - delete`在FreeBSD上不起作用.仅使用`-d`可以提高答案的可移植性. (4认同)
亚历山大：“流编辑器”是指基于行的吗？也许，这个名字令人困惑。 (3认同)
这个问题的'tr'语法似乎非常简单,比sed更容易理解. (2认同)
我的意思是使用sed做一些正则表达式替换它必须匹配包含换行符的字符串.这与OP问题相距甚远. (2认同)

Answer 2

Zso*_*kai 1434

在GNU中使用此解决方案sed:

sed ':a;N;$!ba;s/\n/ /g' file

Run Code Online (Sandbox Code Playgroud)

这将在循环中读取整个文件,然后用空格替换换行符.

说明:

通过创建标签:a.
将当前和下一行附加到模式空间via N.
如果我们在最后一行之前,则跳转到创建的标签$!ba($!意味着不要在最后一行执行,因为应该有一个最终换行符).
最后,替换用模式空间(即整个文件)上的空格替换每个换行符.

这是与BSD和OS X一起使用的跨平台兼容语法sed(根据@Benjie评论):

sed -e ':a' -e 'N' -e '$!ba' -e 's/\n/ /g' file

Run Code Online (Sandbox Code Playgroud)

如您所见,使用sed这个简单的问题是有问题的.有关更简单和适当的解决方案,请参阅此答案.

您可以通过单独执行命令而不是用分号分隔来运行这个跨平台(即在Mac OS X上):`sed -e':'-e'N'-e'$!ba'-e' s/\n// g'` (105认同)
为什么没有人评论这是一个愚蠢的混乱(不是答案本身,而是提出的答案是解决一个非常简单的问题的最佳解决方案).Sed看起来像一辆通常运行良好的汽车,但如果你想开车到附近的特定街道,唯一的办法就是用直升机抬起汽车. (69认同)
`:a`不是寄存器,它是分支标签.它是`b`命令*的目标,其工作方式类似于"goto".将其称为寄存器意味着您可以创建存储位置.只有两个"寄存器"; 一个称为"保留空间",您的脚本未使用,另一个称为"模式空间".`N`命令将换行符和输入文件的下一行附加到模式空间.[*你可以有多个标签和`b`命令.如果你有一个没有附加标签字符的`b`命令,它会跳转到脚本的末尾以读取下一行并再次循环. (50认同)
@Arjan和Masi:OS X使用BSD的`sed`而不是GNU`sed',因此两者之间可能存在一些微妙的(有些不那么微妙的)差异.如果您在OS X和*nix机器上工作,这将是一个持续的痛苦.我通常在OS X上安装GNU的`coreutils`和`findutils`,并忽略BSD版本. (45认同)
来吧伙计们 - 261赞成一个疯狂的,难以理解的解决方案,不起作用???? sed是一个很好的工具,可以在一行上进行简单的替换,只需使用awk即可.好悲伤.... (11认同)
`回声“你好\n世界”| sed -e ':a' -e 'N' -e '$!ba' -e 's/\n/ /g'` 返回 "Hello World"，但 `echo "Hello World" | sed -e ':a' -e 'N' -e '$!ba' -e 's/\n/ /g'` 为我返回一个空字符串。我使用的是 MacOS Big Sur。 (6认同)
这也是'sed':a; {N; s/\n//}; ba'`:P (5认同)
这是一个令人印象深刻的答案。我还觉得讽刺的是，Linux 工具应该“做好一件事”，而大多数 Linux 工具似乎能做很多事情，但效果很差 (5认同)
@EdMorton你是绝对正确的,我不会自己使用它(`tr`对于这个来说简单得多).不过,问题是如何用"sed"来做这件事,在过去的好时光里,我已经读过,理解并回答了这个问题.对我来说它是有效的(虽然我已经阅读了一些用于学习这个奇妙工具的文档,但我确实以某种方式理解了它). (3认同)
好像没有去掉最后一个\n？ (3认同)
输入的最后一行不会被替换.例如`printf'1 \n2 \n3 \n'| sed':a; N; $!ba; s/\n// g'`将给出'1 2 3 \n`. (2认同)
@ZsoltBotykai看到我之前的评论,并且使用\n只能在某些操作系统上的某些seds中工作 - 在sed中指定换行符的可移植方式是反斜杠后跟一个文字换行符.只需阅读上面的评论 - 大约三分之一的人说这对他们不起作用,另外三分之一的人说他们不理解.你不应该像这样的东西使用sed. (2认同)
为什么":a; N; $!ba; s/\n// g"工作而不只是"s/\n// g"？ (2认同)
@trusktr看到这个答案:http://stackoverflow.com/a/7697604/11621有一个从官方sed FAQ复制的解释. (2认同)
@atti $!使整个encantation将所有行累积到模式缓冲区中,然后从该缓冲区进行大量替换并进行一次打印. (2认同)

Answer 3

hdo*_*rio 463

快速回答:

sed ':a;N;$!ba;s/\n/ /g' file

Run Code Online (Sandbox Code Playgroud)

: 创建标签'a'
N 将下一行附加到模式空间
$! 如果不是最后一行,ba 分支(转到)标签'a'
s 替换,/ \n/ 正则表达式为新行,// 由空格,/ g 全局匹配(尽可能多次)

sed将遍历步骤1到3,直到它到达最后一行,让所有行都适合模式空间,其中sed将替换所有\n字符

替代方案:

与sed不同,所有替代方案都不需要到达最后一行来开始该过程

用bash,慢

while read line; do printf "%s" "$line "; done < file

Run Code Online (Sandbox Code Playgroud)

用perl,sed- like速度

perl -p -e 's/\n/ /' file

Run Code Online (Sandbox Code Playgroud)

使用tr,比sed快,只能替换为一个字符

tr '\n' ' ' < file

Run Code Online (Sandbox Code Playgroud)

与粘贴,TR般的速度,可以用一个字符替换只

paste -s -d ' ' file

Run Code Online (Sandbox Code Playgroud)

用awk,tr- like速度

awk 1 ORS=' ' file

Run Code Online (Sandbox Code Playgroud)

其他替代方法如"echo $(<file)"很慢,仅适用于小文件,需要处理整个文件才能开始进程.

来自sed FAQ 5.10的长篇答案:

5.10.为什么我不能使用\n转义
序列匹配或删除换行符？为什么我不能使用\n匹配2行或更多行？

\n将永远不会匹配行尾的换行符,因为
在将行放入
模式空间之前始终会删除换行符.要在模式空间中获得2行或更多行,请使用
"N"命令或类似的命令(例如"H; ...; g;").

Sed的工作方式如下:sed一次读取一行,删除
终止换行符,将剩下的内容放入
sed脚本可以解决或更改它的模式空间
中,打印模式空间时,向stdout添加换行符(或文件).如果
使用"d"或"D"完全或部分删除模式空间,则在这种情况下不会添加
换行符.因此,脚本就像

  sed 's/\n//' file       # to delete newlines from each line             
  sed 's/\n/foo\n/' file  # to add a word to the end of each line

Run Code Online (Sandbox Code Playgroud)

永远不会工作,因为在
将行放入模式空间之前删除了尾随换行符.要执行上述任务,请
改为使用以下脚本之一:

  tr -d '\n' < file              # use tr to delete newlines              
  sed ':a;N;$!ba;s/\n//g' file   # GNU sed to delete newlines             
  sed 's/$/ foo/' file           # add "foo" to end of each line

Run Code Online (Sandbox Code Playgroud)

由于除了GNU sed之外的sed版本对
模式缓冲区的大小有限制,因此Unix'tr'实用程序在这里是首选.
如果文件的最后一行包含换行符,GNU sed会
将该换行符添加到输出中但删除所有其他
换行符,而tr将删除所有换行符.

要匹配两行或更多行的块,有3种基本选择:
(1)使用'N'命令将Next行添加到模式空间;
(2)使用'H'命令至少两次将当前行追加
到Hold空间,然后
用x,g或G 从保留空间中检索行; 或(3)使用地址范围(见上文第3.3节)
来匹配两个指定地址之间的行.

选择(1)和(2)将\n放入模式空间,
可以根据需要对其进行寻址('s/ABC \nXYZ/alphabet/g').
使用"N"删除行块的一个示例显示在4.13节
("如何删除特定连续行的块？")中.
可以通过将delete命令更改为其他
内容来修改此示例,例如'p'(打印),'i'(插入),'c'(更改),'a'(追加)
或's'(替换) .

选择(3)不会将\n放入模式空间,但它确实
匹配连续行的块,因此您可能
甚至不需要\n来找到您要查找的内容.由于GNU sed
版本3.02.80现在支持这种语法:

  sed '/start/,+4d'  # to delete "start" plus the next 4 lines,

Run Code Online (Sandbox Code Playgroud)

除了传统的'/ from here /,/ to there/{...}'范围
地址之外,还可以完全避免使用\n.

`tr`是个好主意,你的整体报道可以提供最优质的答案. (6认同)
关于这个答案最好的部分是"长答案"解释了命令的工作原理和原因. (4认同)
+1 用于使用 ([标准实用程序](http://pubs.opengroup.org/onlinepubs/9699919799/utilities/paste.html)) `paste`... 以及所有其他！ (2认同)
这可能是我在stackexchange上阅读的数千个答案中最有帮助的.我需要跨行匹配多个字符.没有先前的sed示例涵盖多行和tr无法处理多个字符匹配.Perl看起来不错,但是没有像我期望的那样工作.如果可以的话,我会多次投票给这个答案. (2认同)

Answer 4

Tho*_*hor 218

更短的awk替代方案:

awk 1 ORS=' '

Run Code Online (Sandbox Code Playgroud)

说明

awk程序由条件代码块组成的规则构成,即:

condition { code-block }

Run Code Online (Sandbox Code Playgroud)

如果省略代码块,则使用默认值:{ print $0 }.因此,它1被解释为真实条件并且print $0对每一行执行.

当awk读取输入时,它会根据RS(记录分隔符)的值将其拆分为记录,默认情况下是新行,因此awk默认情况下会解析输入行.拆分还涉及RS从输入记录中剥离.

现在,在打印记录时,ORS(输出记录分隔符)会附加到其上,默认值也是换行符.因此,通过更改ORS为空格,所有换行都将更改为空格.

如果它更有意义,这可以有效地写成:`awk'BEGIN {ORS =""} {print $ 0} END {print"\n"}'file.txt`(添加结尾换行只是为了说明开始/结束); "1"评估为"true"(处理行)和"print"(打印行).条件也可以添加到此表达式中,例如,仅处理匹配模式的行:`awk'BEGIN {ORS =""}/pattern/{print $ 0} END {print"\n"}'` (8认同)
我非常喜欢这个简单的解决方案,它比其他解决方案更具可读性 (5认同)
你可以做得更简单：`code` awk 'ORS=" "' file.txt `code` (2认同)
@Jonah：这是设置变量的另一种方法，请参见例如[GNU awk 手册](https://www.gnu.org/software/gawk/manual/gawk.html#Other-Arguments) (2认同)

Answer 5

JJo*_*oao 133

gnu sed有一个-z空分隔记录(行)选项.你可以打电话:

sed -z 's/\n/ /g'

Run Code Online (Sandbox Code Playgroud)

如果没有空值,这不会加载整个输入吗？在这种情况下,处理一个数千兆字节的文件可能会崩溃. (6认同)
这是**最好的**答案.其他表达式太扭曲而无法记住.@JJoao您可以将它与`-u, - unbuffered`一起使用.`man` mage说:"从输入文件加载最少量的数据并更频繁地刷新输出缓冲区". (6认同)
即使输入确实包含空值,它们也将被保留(作为记录分隔符). (4认同)
@Ruslan,是的,它加载了整个输入.对于千兆字节的文件,这个解决方案不是一个好主意. (3认同)
很少使用的“y”命令也可以完成这项工作“sed -z 'y/\n/ /' file”。 (2认同)

Answer 6

ire*_*ses 84

在Perl的版本的作品您预期的方式.

perl -i -p -e 's/\n//' file

Run Code Online (Sandbox Code Playgroud)

正如评论中指出的那样,值得注意的是,这种编辑已经到位.-i.bak如果您的正则表达式没有您想象的那么聪明,它会在替换之前为您提供原始文件的备份.

请至少提一下,没有后缀的`-i`会使*没有备份*.`-i.bak`保护你免受一个简单,丑陋的错误(比如,忘记键入`-p`并将文件归零). (22认同)
@Telemachus:这是一个公平的观点,但无论如何都可以争论.我没有提到它的主要原因是OP问题中的sed示例没有进行备份,因此这里似乎是多余的.另一个原因是我从未真正使用过备份功能(实际上我发现自动备份很烦人),所以我总是忘记它在那里.第三个原因是它让我的命令行变长了四个字符.无论好坏(可能更糟),我都是一个强迫性的极简主义者; 我只是喜欢简洁.我意识到你不同意.我将尽力记住将来警告备份. (5认同)
@Ire_and_curses:实际上,你只是因为无视我而做出了一个非常好的论据.也就是说,你有理由做出选择,无论我是否同意这些选择,我当然都会尊重这一点.我不确定为什么,但我最近对这个特殊的东西一直在撕裂(Perl中的`-i`标志没有后缀).我相信我很快就能找到别的东西来讨论.:) (5认同)

Answer 7

com*_*ike 44

谁需要sed？这是bash方式:

cat test.txt |  while read line; do echo -n "$line "; done

Run Code Online (Sandbox Code Playgroud)

甚至没有使用`cat`:`读取线; 做echo -n"$ line"; 完成<test.txt`.如果子shell是个问题,可能会有用. (10认同)
@Tony因为反引号被弃用而且cat是多余的;-)使用:echo $(<days.txt) (9认同)
`echo $(<file)`将所有**空格压缩到一个空格,而不仅仅是换行:这超出了OP所要求的范围. (5认同)
Upvote,我通常使用最佳答案,但是当通过它来管道/ dev/urandom时,sed将不会打印直到EOF,而^ C不是EOF.每次看到换行符时都会打印此解决方案.正是我需要的!谢谢! (2认同)

Answer 8

Pau*_*ce. 26

为了使用awk替换所有换行符,而不将整个文件读入内存:

awk '{printf "%s ", $0}' inputfile

Run Code Online (Sandbox Code Playgroud)

如果你想要一个最终换行符:

awk '{printf "%s ", $0} END {printf "\n"}' inputfile

Run Code Online (Sandbox Code Playgroud)

您可以使用空格以外的字符:

awk '{printf "%s|", $0} END {printf "\n"}' inputfile

Run Code Online (Sandbox Code Playgroud)

`END{ print ""}` 是尾随换行符的更短替代方案。 (2认同)

Answer 9

bre*_*ner 21

三件事.

trcat绝对不需要(或等).(GNU)sed和(GNU)awk合并后,可以完成99.9%的文本处理.
stream!=基于行.ed是一个基于行的编辑器.sed不是.有关差异的更多信息,请参阅sed讲座.大多数人混淆sed是基于行的,因为默认情况下,它在SIMPLE匹配的模式匹配中并不是非常贪婪 - 例如,在进行模式搜索并替换一个或两个字符时,默认情况下它只替换第一个匹配它找到(除非全局命令另有指定).如果它是基于行的而不是基于STREAM的,那么甚至不会有全局命令,因为它一次只评估行.试试跑步ed; 你会发现差异.ed如果你想迭代特定的行(例如在for循环中),但是大多数时候你只想要它,这非常有用sed.
话虽如此,
```
sed -e '{:q;N;s/\n/ /g;t q}' file
```
Run Code Online (Sandbox Code Playgroud)
在GNU sed版本4.2.1中工作得很好.上面的命令将用空格替换所有换行符.输入它很难看并且有点麻烦,但它工作得很好.这{}可以省略,因为它们仅出于理智的原因而被包括在内.

什么是'one`？我不知道这个命令! (3认同)
这比大输入时接受的答案慢了近 800 倍。这是由于在越来越大的输入上运行替代品。 (3认同)
作为一个只知道"sed"来做基本事情的人,我不得不说这不仅仅是你能用'sed`做什么,而是知道发生了什么是多么容易.我在使用`sed`时非常困难,所以当我可以使用它时,我更喜欢更简单的命令. (2认同)

Answer 10

小智 21

tr '\n' ' '

Run Code Online (Sandbox Code Playgroud)

是命令.

简单易用.

或者只是`tr -d'\n'`如果你不想添加空格 (13认同)

Answer 11

小智 17

cat file | xargs

Run Code Online (Sandbox Code Playgroud)

为了完整起见