我最近一直在研究各种文本编码,但找不到任何关于如何在管道中编码数据的好来源。
以下是我的一些一般假设:
这些准确吗?有人可以扩展这些在具有不同默认值的系统中如何工作吗?
继续提问:
cat
发送到终端?他们在 unicode 中“思考”吗?或者他们只是读取字节并发送字节,由终端来解释编码文本?我曾尝试在终端中更改编码,但似乎没有帮助。
$ printf 'ö' | hexdump
0000000 c3 b6
0000002
Run Code Online (Sandbox Code Playgroud)
$ export LANG=en_US.UTF-16
$ printf 'ö' | hexdump
0000000 c3 b6
0000002
Run Code Online (Sandbox Code Playgroud)