GNU sed (for Windows) 可以处理 Unicode 吗？如果是这样，它是代码页/区域设置问题还是开关？

Question

GNU sed (for Windows) 可以处理 Unicode 吗？如果是这样，它是代码页/区域设置问题还是开关？

Pet*_*r.O 10 windows encoding gnu unicode sed

我已经断断续续地使用 GNU SED 几年了。有时它让我感到有些困惑，但它做得很好......对于单字节字符集！
我时不时地注意到对 GNU SED 的引用是 Unicode 感知的，但我见过的最接近的是它的“二进制”模式……而二进制不是 Unicode。
GSED 能否以 CodePoint 分辨率处理 Unicode 文本文件，包括尤其是 \r\n (Windows)...如果可以，它是否需要 UTF-8、UTF-16 或什么？SED 如何检测编码？

Answer 1

Van*_*pps 1

我对 sed 不太了解，但经过一番艰苦的谷歌搜索后，它似乎通过 LANG 环境变量支持各种代码页。我相信 UTF-8 实际上是没有 LANG 时的默认值。我不知道 Windows 端口是如何设置的。我确实强烈怀疑 sed 对输入流根本不执行任何检测处理。

资料来源：/sf/ask/4718731/ http://omgili.com/mailinglist/cygwin/cygwin/com /20100520123926GA1432onderneming10xs4allnl.html

您也可以尝试转义字符，如下所述：http://forums.whirlpool.net.au/forum-replies-archive.cfm/841095.html 但这看起来很麻烦。

我已经解决了这个问题......大约6个月前我完全放弃了MS，现在使用Ubuntu..它像丝绸一样光滑......（而且我不会回头...... (2认同)

归档时间：	15 年，6 月前
查看次数：	4887 次
最近记录：	12 年，9 月前