U2E*_*EF1 10 compression math comparison string-comparison
UTF-8的一个优点是,如果你逐个字节地比较两个字符串(带有<),你会得到相同的答案,就好像你比较了它们逐个代码点.我想知道是否有类似的编码是最佳的大小(例如UTF-8"浪费"空间,通过用10xxxxxx标记字节,如果它们不是表示代码点的第一个字节).
这里的最优性假设是,如果n < m,则非负数n比数m更频繁.
我最感兴趣的是知道是否存在适用于整数的(字节可比较的)编码,其中n比m更频繁.n | <| m |.