我正在编写一个像 file(1) 这样的程序,它可以猜测文本文件是否包含 ascii 字符、ISO-8859-1 字符或 UTF-8。我已经将其编程为猜测 ascii 和 ISO,只剩下 UTF-8。我的问题是我应该使用位移位,虽然我知道位移位的基础知识,但我无法弄清楚如何使用它来猜测 UTF-8 字符。我当然不是在寻求解决方案,但如果有人能将我推向正确的方向,我会很高兴!
我是用C写的。
c utf-8 bit-shift
bit-shift ×1
c ×1
utf-8 ×1