itu*_*tun 3 java unicode character-encoding
我从文件中读取了编码为"UTF-8"的字符串.我需要将它与表达式相匹配.文件的第一个字符是#
,但在字符串中第一个是''
(空符号).我用charset"UTF-8"把它翻译成字节,就在这里[-17, -69, -65]
.有谁知道它是什么以及如何用正则表达式解决它?
某些编辑器(如记事本)在保存UTF-8文本时添加BOM(字节顺序掩码)签名.您应该在从此类文件读取字符串之前检查0xEF,0xBB,0xBF字节,如果它们存在则跳过它们.
另一种方法是不要使用记事本来编辑UTF-8文本,得到其他程序,如Notepad ++,Kate或任何与你可以控制添加BOM的女巫.
归档时间: |
|
查看次数: |
1056 次 |
最近记录: |