use*_*627 19 encoding character-encoding
我正在开发一个纯文本阅读器应用程序.有时app无法自动确定文件的编码,因此用户需要从编码列表中选择编码.如果此列表包含所有支持的编码,则它将太长.我想提供一个简化的列表,只包含每种语言最常见的编码.
这是我所知道的一些关系:
如果您知道任何其他语言最常见的编码,请告诉我.
dan*_*n04 55
FWIW,以下是按默认字符编码分组的Windows XP区域设置:
网络上最常见的编码:
HTML5 草案包含一个语言的默认编码表,反映了被视为常见的内容。但是,请注意,它应该基于用户区域设置,即浏览器或操作系统的语言,而不是文档的语言——显然因为后者通常是未知的,至少在您实际阅读文档之前,基于对编码的一些假设。
我认为您实际上可以在流行的网络浏览器中复制编码列表。如果它在那里运行良好,它可能在您的应用程序中运行良好。浏览器对列表及其顺序做了一些聪明的事情,但在实践中,我认为有一个像 utf-8、utf-16、windows-1252 和其他一些的短列表就足够了,然后是一个选项获取完整列表。请注意,尽管 utf-16 实际上对网页没有使用和无用,但它对于周围的纯文本文件很常见。为编码命名非常重要,最好使用常见的英语(或其他语言)名称和括号中的 IANA“字符集”名称 - 就像浏览器所做的那样。