如技术报告中所述,其中的某些条目UnicodeData.txt是字符范围:
为了向后兼容,文件
UnicodeData.txt中的范围由范围的开始和结束字符的条目指定,而不是由“ X..Y”形式指定。起始字符由范围标识符指示,后跟尖括号中的逗号和字符串“ First”。该条目代替该行的字段1中的常规字符名称。结束字符在下一行用相同的范围标识符表示,后跟尖括号中的逗号和字符串“ Last”:
4E00;<CJK Ideograph, First>;Lo;0;L;;;;;N;;;;;
9FEF;<CJK Ideograph, Last>;Lo;0;L;;;;;N;;;;;
Run Code Online (Sandbox Code Playgroud)
换句话说,UnicodeData.txt文件中的行数与数据库中的字符数不同。一些字符范围由仅两行编码的成百上千个字符组成。
| 归档时间: |
|
| 查看次数: |
52 次 |
| 最近记录: |