Car*_*ten 4 java arrays sorting utf-8 lexicographic
如果我有一个字典排序的Java字符串列表[s1,s2,s3,s4, ...., sn],然后使用UTF-8编码将每个字符串转换为字节数组bx = sx.getBytes("UTF-8"),字节数组的列表是否[b1,b2,b3,...bn]也按字典排序?
是.根据RFC 3239:
UTF-8字符串的字节值字典排序顺序与按字符数排序的相同.当然,这是有限的兴趣,因为基于字符数的排序顺序几乎从不在文化上有效.
正如Ian Roberts指出的那样,这适用于" 真正的 UTF-8(例如String.getBytes会给你)",但要注意DataInputStream假的UTF-8,它将在[U + 000001]和[U]之后对[U + 000000]进行排序在[U + 10FFFF]之后+ 00F000].
| 归档时间: |
|
| 查看次数: |
7274 次 |
| 最近记录: |