我可以在UTF-8编码的XML中包含诸如"ã"和"ê"之类的字符,还是必须是UTF-16编码的?

Eri*_*air 1 xml encoding utf-8 utf-16 character-encoding

我可以在UTF-8编码的XML中包含诸如"ã"和"ê"之类的字符,还是必须是UTF-16编码的?

Joh*_*don 7

您可以使用UTF-8编码这些字符.

关键是保持prolog(<?xml version="1.0" encoding="utf-8" ?>)和实际文件编码一致.

UTF-8的重点是能够以更小的占用空间编码所有Unicode字符.根据所有智慧的来源,维基百科,utf-8以1到4个字节对每个字符点进行编码,并向后兼容ASCII

  • @ dan04:但是75-90%的XML文件是标签垃圾,因此ASCII的较小表示超过了U + 0800-U + FFFF范围的任何增长.:-) (2认同)

Ign*_*ams 6

所有Unicode转换格式编码都可以编码Unicode中的任何字符.给出的字符可在Unicode标准中找到.