GNU sed (for Windows) 可以处理 Unicode 吗?如果是这样,它是代码页/区域设置问题还是开关?

Pet*_*r.O 10 windows encoding gnu unicode sed

我已经断断续续地使用 GNU SED 几年了。有时它让我感到有些困惑,但它做得很好......对于单字节字符集!
我时不时地注意到对 GNU SED 的引用是 Unicode 感知的,但我见过的最接近的是它的“二进制”模式……而二进制不是 Unicode。
GSED 能否以 CodePoint 分辨率处理 Unicode 文本文件,包括尤其是 \r\n (Windows)...如果可以,它是否需要 UTF-8、UTF-16 或什么?SED 如何检测编码?

Van*_*pps 1

我对 sed 不太了解,但经过一番艰苦的谷歌搜索后,它似乎通过 LANG 环境变量支持各种代码页。我相信 UTF-8 实际上是没有 LANG 时的默认值。我不知道 Windows 端口是如何设置的。我确实强烈怀疑 sed 对输入流根本不执行任何检测处理。

资料来源:/sf/ask/4718731/ http://omgili.com/mailinglist/cygwin/cygwin/com /20100520123926GA1432onderneming10xs4allnl.html

您也可以尝试转义字符,如下所述:http://forums.whirlpool.net.au/forum-replies-archive.cfm/841095.html 但这看起来很麻烦。

  • 我已经解决了这个问题......大约6个月前我完全放弃了MS,现在使用Ubuntu..它像丝绸一样光滑......(而且我不会回头...... (2认同)