整理强度和当地语言关系

Ara*_*ram 10 localization collation internationalization

我从Collat​​or的Javadoc中读到了以下内容.

"语言特征的优势的确切分配取决于语言环境.例如,在捷克语中,"e"和"f"被认为是主要差异,而"e"和"ê"是次要差异,"e"和"E"是三级差异,"e"和"e"是相同的."

这是否意味着我应该根据我使用的语言设置STRENGTH?如果是这样,有人可以建议语言环境的默认值:us_en,us_es,ca_fr,spain_spanish,chile_spanish,portuguese

Joh*_*gko 11

真的取决于你想要做什么.对于使用拉丁字母的大多数(所有?)语言,情况如下:

    • 不同:a,á,Á,b
    • 相同:á,â
    • 相同:a,A
  • 次要
    • 不同:a,á,Á,b
    • 不同:á,â
    • 相同:a,A
  • 第三
    • 不同:a,á,Á,b
    • 不同:á,â
    • 不同:a,A
  • 相同
    • 还要考虑你看不到的差异,例如(accented A)和之间(A) + (accent)

语言之间会有细微差别,但实质上:

  • 如果您想要区分大小写,请使用Tertiary.
  • 对于不区分大小写的比较,请使用Primary或​​Secondary,具体取决于您是否要将á与â分组.
  • 一些整理规则很奇怪.a即使在Primary中也不同于á,即使在Primary/Secondary中,á也不同于Á.我不知道为什么; 也许吧?
  • 谁知道非拉丁语言会发生什么.