Pet*_*r.O 10 windows encoding gnu unicode sed
我已经断断续续地使用 GNU SED 几年了。有时它让我感到有些困惑,但它做得很好......对于单字节字符集!
我时不时地注意到对 GNU SED 的引用是 Unicode 感知的,但我见过的最接近的是它的“二进制”模式……而二进制不是 Unicode。
GSED 能否以 CodePoint 分辨率处理 Unicode 文本文件,包括尤其是 \r\n (Windows)...如果可以,它是否需要 UTF-8、UTF-16 或什么?SED 如何检测编码?
我对 sed 不太了解,但经过一番艰苦的谷歌搜索后,它似乎通过 LANG 环境变量支持各种代码页。我相信 UTF-8 实际上是没有 LANG 时的默认值。我不知道 Windows 端口是如何设置的。我确实强烈怀疑 sed 对输入流根本不执行任何检测处理。
资料来源:/sf/ask/4718731/ http://omgili.com/mailinglist/cygwin/cygwin/com /20100520123926GA1432onderneming10xs4allnl.html
您也可以尝试转义字符,如下所述:http://forums.whirlpool.net.au/forum-replies-archive.cfm/841095.html 但这看起来很麻烦。
| 归档时间: |
|
| 查看次数: |
4887 次 |
| 最近记录: |