区域设置特定索引字符

Pet*_*rta 5 language-agnostic unicode locale

我想有一个列表的索引.例如,Android联系人列表包含#,AZ.但是对于许多语言环境,这并未涵盖所有特定于语言环境的字符.

如何在不同的编程语言中支持这一点?我快速浏览一下,如果是核心Java,我没有看到任何东西

有点相关:http: //cldr.unicode.org/development/development-process/design-proposals/index-characters

tch*_*ist 3

这个问题问得好

\n\n

正如您在与标签中注意到的那样,重要的是\xe2\x80\x99t 编程语言。它\xe2\x80\x99是你真正需要的数据集。据我所知,没有此类东西的存储库。\xe1\xb4\x84\xca\x9f\xe1\xb4\x85\xca\x80 数据还不包含这个东西。这里 \xe2\x80\x99 是一个简单的序列表,用于各种两个字母 \xc9\xaas\xe1\xb4\x8f 代码,以及一些用 Perl 编写的亚洲序列的附加内容。这类东西可以作为模块的基础。

\n\n

它确实需要小心处理,因为如果您想要一个“大写”集,您可以\xe2\x80\x99t 盲目地对每个元素中的第一个字素进行标题化,而不考虑区域设置。那\xe2\x80\x99s是因为突厥I问题。我会安装提取序列的方法,并在他们要求突厥语言中的内容时检测此类内容。

\n\n
use utf8;\nuse strict;\nuse warnings;\n\nour %Alphabet = (\n    en => [qw(a b c d e f g h i j k l m n o p q r s t u v w x y z)],\n\n    br => [qw(a b ch c\'h d e f g h i j k l m n o p r s t u v w y z)],\n    cy => [qw(a b c ch d dd e f ff g ng h i l ll m n o p ph r rh s t th u w y)],\n    ga => [qw(a \xc3\xa1 b c d e \xc3\xa9 f g h i \xc3\xad l m n o \xc3\xb3 p r s t u \xc3\xba)],\n    gd => [qw(a b c d e f g h i l m n o p r s t u)],\n\n    la => [qw(a b c d e f g h i k l m n o p q r s t v x y z)],\n    it => [qw(a b c d e f g h i k l m n o p q r s t u v z)],\n    es => [qw(a b c d e f g h i j k l m n \xc3\xb1 o p q r s t u v w x y z)],\n    es__traditional =>\n          [qw(a b c ch d e f g h i j k l ll m n \xc3\xb1 o p q r s t u v w x y z)],\n    eu => [qw(a b c ch d e f g h i j k l ll m n \xc3\xb1 o p q r s t ts tx tz u v w x y z)],\n    rm => [qw(a b c d e f g h i j l m n o p q r s t u v x z)],\n    ro => [qw(a \xc4\x83 \xc3\xa2 b c d e f g h i \xc3\xae j k l m n o p q r s \xc8\x99 t \xc8\x9b u v w x y z)],\n    oc => [qw(a b c d e f g h i j l m n o p q r s t u v x z)],\n\n    sw => [qw(a b c d e f g h i j k l m n o p q r s t u v w x y z \xc3\xa5 \xc3\xa4 \xc3\xb6)],\n    no => [qw(a b c d e f g h i j k l m n o p q r s t u v w x y z \xc3\xa6 \xc3\xb8 \xc3\xa5)],\n    is => [qw(a \xc3\xa1 b d \xc3\xb0 e \xc3\xa9 f g h i \xc3\xad j k l m n o \xc3\xb3 p r s t u \xc3\xba v x y \xc3\xbd \xc3\xbe \xc3\xa6 \xc3\xb6)],\n\n    cz => [qw(a \xc3\xa1 b c \xc4\x8d d \xc4\x8f e \xc3\xa9 \xc4\x9b f g h ch i \xc3\xad j k l m n \xc5\x88 o \xc3\xb3 p q r \xc5\x99 s \xc5\xa1 t \xc5\xa5 u \xc3\xba \xc5\xaf v w x y \xc3\xbd z \xc5\xbe)],\n    sk => [qw(a \xc3\xa1 \xc3\xa4 b c \xc4\x8d d \xc4\x8f dz d\xc5\xbe e \xc3\xa9 f g h ch i \xc3\xad j k l \xc4\xba \xc4\xbe m n \xc5\x88 o \xc3\xb3 \xc3\xb4 p q r \xc5\x95 s \xc5\xa1 t \xc5\xa5 u \xc3\xba v w x y \xc3\xbd z \xc5\xbe)],\n    sl => [qw(a b c \xc4\x8d d e f g h i j k l m n o p r s \xc5\xa1 t u v z \xc5\xbe)],\n\n    pl => [qw(a \xc4\x85 b c \xc4\x87 d e \xc4\x99 f g h i j k l \xc5\x82 m n \xc5\x84 o \xc3\xb3 p r s \xc5\x9b t u w y z \xc5\xba \xc5\xbc)],\n\n    lt => [qw(a \xc4\x85 b c \xc4\x8d d e \xc4\x99 \xc4\x97 f g h i \xc4\xaf y j k l m n o p r s \xc5\xa1 t u \xc5\xb3 \xc5\xab v z \xc5\xbe)],\n    lv => [qw(a \xc4\x81 b c \xc4\x8d d e \xc4\x93 f g \xc4\xa3 h i \xc4\xab j k \xc4\xb7 l \xc4\xbc m n \xc5\x86 o p r s \xc5\xa1 t u \xc5\xab v z \xc5\xbe)],\n    et => [qw(a b d e f g h i j k l m n o p r s \xc5\xa1 z \xc5\xbe t u v \xc3\xb5 \xc3\xa4 \xc3\xb6 \xc3\xbc)],\n    et__full =>\n          [qw(A B C D E F G H I J K L M N O P Q R S \xc5\xa0 Z \xc5\xbd T U V W \xc3\x95 \xc3\x84 \xc3\x96 \xc3\x9c X Y)],\n    et__simple => [qw(a b d e g h i j k l m n o p r s t u v \xc3\xb5 \xc3\xa4 \xc3\xb6 \xc3\xbc)],\n\n    hu => [qw(a \xc3\xa1 b c cS d dz dzs e \xc3\xa9 f g gy H i \xc3\xad j k l ly M n ny O \xc3\xb3 \xc3\xb6 \xc5\x91 p q r s sz t ty u \xc3\xba \xc3\xbc \xc5\xb1 v w x y z zs)],\n    hu__traditional =>\n          [qw(a \xc3\xa1 b c cs d dz dzs e \xc3\xa9 f g gy h i \xc3\xad j k l ly m n ny o \xc3\xb3 \xc3\xb6 \xc5\x91 p r s sz t ty u \xc3\xba \xc3\xbc \xc5\xb1 v z zs)],\n\n    tr => [qw(a b c \xc3\xa7 d e f g \xc4\x9f h \xc4\xb1 i j k l m n o \xc3\xb6 p r s \xc5\x9f t u \xc3\xbc v y z)],\n    az => [qw([a b c \xc3\xa7 d e \xc9\x99 f g \xc4\x9f h x \xc4\xb1 i j k q l m n o \xc3\xb6 p r s \xc5\x9f t u \xc3\xbc v y z)],\n    az_1918_1939 =>\n        [qw(a \xd0\xb2 c \xc3\xa7 d e \xc9\x99 f g \xc6\xa3 h i \xd1\x8c j k q l m n o \xc9\xb5 p r s \xc5\x9f t u v x y z \xc6\xb6)],\n    az_1939_1958 =>\n        [qw(\xd0\xb0 \xd0\xb1 \xd0\xb2 \xd0\xb3 \xd2\x93 \xd0\xb4 \xd0\xb5 \xd1\x91 \xd3\x99 \xd0\xb6 \xd0\xb7 \xd0\xb8 \xd0\xb9 \xd0\xba \xd2\x9b \xd0\xbb \xd0\xbc \xd0\xbd \xd0\xbe \xd3\xa9 \xd0\xbf \xd1\x80 \xd1\x81 \xd1\x82 \xd1\x83 \xd2\xaf \xd1\x84 \xd1\x85 h \xd1\x86 \xd1\x87 \xd2\xb7 \xd1\x88 \xd1\x89 \xd1\x8a \xd1\x8b \xd1\x8c \xd1\x8d \xd1\x8e \xd1\x8f \')],\n    az_1958_1991 =>\n        [qw(\xd0\xb0 \xd0\xb1 \xd0\xb2 \xd0\xb3 \xd2\x93 \xd0\xb4 e \xd3\x99 \xd0\xb6 \xd0\xb7 \xd0\xb8 \xd1\x8b \xd1\x98 \xd0\xba \xd2\x9d \xd0\xbb \xd0\xbc \xd0\xbd \xd0\xbe \xd3\xa9 \xd0\xbf \xd1\x80 \xd1\x81 \xd1\x82 \xd1\x83 \xd2\xaf \xd1\x84 \xd1\x85 \xd2\xbb \xd1\x87 \xd2\xb9 \xd1\x88 \')],\n    az_1991_1992 =>\n        [qw(a \xc3\xa4 b c \xc3\xa7 d e f g \xc4\x9f h x \xc4\xb1 i j k q l m n o \xc3\xb6 p r s \xc5\x9f t u \xc3\xbc v y z)],\n\n    he => [qw(\xce\xb1 \xce\xb2 \xce\xb3 \xce\xb4 \xce\xb5 \xce\xb6 \xce\xb7 \xce\xb8 \xce\xb9 \xce\xba \xce\xbb \xce\xbc \xce\xbd \xce\xbe \xce\xbf \xcf\x80 \xcf\x81 \xcf\x83 \xcf\x84 \xcf\x85 \xcf\x86 \xcf\x87 \xcf\x88 \xcf\x89)],\n\n    ru => [qw(\xd0\xb0 \xd0\xb1 \xd0\xb2 \xd0\xb3 \xd0\xb4 \xd0\xb5 \xd0\xb6 \xd0\xb7 \xd0\xb8 \xd0\xba \xd0\xbb \xd0\xbc \xd0\xbd \xd0\xbe \xd0\xbf \xd1\x80 \xd1\x81 \xd1\x82 \xd1\x83 \xd1\x84 \xd1\x85 \xd1\x86 \xd1\x87 \xd1\x88 \xd1\x89 \xd1\x8b \xd1\x8d \xd1\x8e \xd1\x8f)],\n    uk => [qw(\xd0\xb0 \xd0\xb1 \xd0\xb2 \xd0\xb3 \xd2\x91 \xd0\xb4 \xd0\xb5 \xd1\x94 \xd0\xb6 \xd0\xb7 \xd0\xb8 \xd1\x96 \xd1\x97 \xd0\xb9 \xd0\xba \xd0\xbb \xd0\xbc \xd0\xbd \xd0\xbe \xd0\xbf \xd1\x80 \xd1\x81 \xd1\x82 \xd1\x83 \xd1\x84 \xd1\x85 \xd1\x86 \xd1\x87 \xd1\x88 \xd1\x89 \xd1\x8c \xd1\x8e \xd1\x8f)],\n    mk => [qw(\xd0\xb0 \xd0\xb1 \xd0\xb2 \xd0\xb3 \xd0\xb4 \xd1\x93 \xd0\xb5 \xd0\xb6 \xd0\xb7 \xd1\x95 \xd0\xb8 \xd1\x98 / \xd0\xba \xd0\xbb \xd1\x99 \xd0\xbc \xd0\xbd \xd1\x9a \xd0\xbe \xd0\xbf \xd1\x80 \xd1\x81 \xd1\x82 \xd1\x9c / \xd1\x83 \xd1\x84 \xd1\x85 \xd1\x86 \xd1\x87 \xd1\x9f \xd1\x88)],\n\n\n    "HIRAGANA AIUEO" =>\n         [qw(\xe3\x81\x82 \xe3\x81\x84 \xe3\x81\x86 \xe3\x81\x88 \xe3\x81\x8a \xe3\x81\x8b \xe3\x81\x8d \xe3\x81\x8f \xe3\x81\x91 \xe3\x81\x93 \xe3\x81\x95 \xe3\x81\x97 \xe3\x81\x99 \xe3\x81\x9b \xe3\x81\x9d \xe3\x81\x9f \xe3\x81\xa1 \xe3\x81\xa4 \xe3\x81\xa6 \xe3\x81\xa8 \xe3\x81\xaa \xe3\x81\xab \xe3\x81\xac \xe3\x81\xad \xe3\x81\xae \xe3\x81\xaf \xe3\x81\xb2 \xe3\x81\xb5 \xe3\x81\xb8 \xe3\x81\xbb \xe3\x81\xbe \xe3\x81\xbf \xe3\x82\x80 \xe3\x82\x81 \xe3\x82\x82 \xe3\x82\x84 \xe3\x82\x86 \xe3\x82\x88 \xe3\x82\x89 \xe3\x82\x8a \xe3\x82\x8b \xe3\x82\x8c \xe3\x82\x8d \xe3\x82\x8f \xe3\x82\x92 \xe3\x82\x93)],\n    "KATAKANA AIUEO" =>\n         [qw(\xe3\x82\xa2 \xe3\x82\xa4 \xe3\x82\xa6 \xe3\x82\xa8 \xe3\x82\xaa \xe3\x82\xab \xe3\x82\xad \xe3\x82\xaf \xe3\x82\xb1 \xe3\x82\xb3 \xe3\x82\xb5 \xe3\x82\xb7 \xe3\x82\xb9 \xe3\x82\xbb \xe3\x82\xbd \xe3\x82\xbf \xe3\x83\x81 \xe3\x83\x84 \xe3\x83\x86 \xe3\x83\x88 \xe3\x83\x8a \xe3\x83\x8b \xe3\x83\x8c \xe3\x83\x8d \xe3\x83\x8e \xe3\x83\x8f \xe3\x83\x92 \xe3\x83\x95 \xe3\x83\x98 \xe3\x83\x9b \xe3\x83\x9e \xe3\x83\x9f \xe3\x83\xa0 \xe3\x83\xa1 \xe3\x83\xa2 \xe3\x83\xa4 \xe3\x83\xa6 \xe3\x83\xa8 \xe3\x83\xa9 \xe3\x83\xaa \xe3\x83\xab \xe3\x83\xac \xe3\x83\xad \xe3\x83\xaf \xe3\x83\xb2 \xe3\x83\xb3)],\n    "HALFWIDTH KATAKANA AIUEO" =>\n        [qw(\xef\xbd\xb1 \xef\xbd\xb2 \xef\xbd\xb3 \xef\xbd\xb4 \xef\xbd\xb5 \xef\xbd\xb6 \xef\xbd\xb7 \xef\xbd\xb8 \xef\xbd\xb9 \xef\xbd\xba \xef\xbd\xbb \xef\xbd\xbc \xef\xbd\xbd \xef\xbd\xbe \xef\xbd\xbf \xef\xbe\x80 \xef\xbe\x81 \xef\xbe\x82 \xef\xbe\x83 \xef\xbe\x84 \xef\xbe\x85 \xef\xbe\x86 \xef\xbe\x87 \xef\xbe\x88 \xef\xbe\x89 \xef\xbe\x8a \xef\xbe\x8b \xef\xbe\x8c \xef\xbe\x8d \xef\xbe\x8e \xef\xbe\x8f \xef\xbe\x90 \xef\xbe\x91 \xef\xbe\x92 \xef\xbe\x93 \xef\xbe\x94 \xef\xbe\x95 \xef\xbe\x96 \xef\xbe\x97 \xef\xbe\x98 \xef\xbe\x99 \xef\xbe\x9a \xef\xbe\x9b \xef\xbe\x9c \xef\xbd\xa6 \xef\xbe\x9d)],\n    "KATAKANA IROHA" =>\n         [qw(\xe3\x82\xa4 \xe3\x83\xad \xe3\x83\x8f \xe3\x83\x8b \xe3\x83\x9b \xe3\x83\x98 \xe3\x83\x88 \xe3\x83\x81 \xe3\x83\xaa \xe3\x83\x8c \xe3\x83\xab \xe3\x83\xb2 \xe3\x83\xaf \xe3\x82\xab \xe3\x83\xa8 \xe3\x82\xbf \xe3\x83\xac \xe3\x82\xbd \xe3\x83\x84 \xe3\x83\x8d \xe3\x83\x8a \xe3\x83\xa9 \xe3\x83\xa0 \xe3\x82\xa6 \xe3\x83\xb0 \xe3\x83\x8e \xe3\x82\xaa \xe3\x82\xaf \xe3\x83\xa4 \xe3\x83\x9e \xe3\x82\xb1 \xe3\x83\x95 \xe3\x82\xb3 \xe3\x82\xa8 \xe3\x83\x86 \xe3\x82\xa2 \xe3\x82\xb5 \xe3\x82\xad \xe3\x83\xa6 \xe3\x83\xa1 \xe3\x83\x9f \xe3\x82\xb7 \xe3\x83\xb1 \xe3\x83\x92 \xe3\x83\xa2 \xe3\x82\xbb \xe3\x82\xb9)],\n    "HIRAGANA IROHA" =>\n         [qw(\xe3\x81\x84 \xe3\x82\x8d \xe3\x81\xaf \xe3\x81\xab \xe3\x81\xbb \xe3\x81\xb8 \xe3\x81\xa8 \xe3\x81\xa1 \xe3\x82\x8a \xe3\x81\xac \xe3\x82\x8b \xe3\x82\x92 \xe3\x82\x8f \xe3\x81\x8b \xe3\x82\x88 \xe3\x81\x9f \xe3\x82\x8c \xe3\x81\x9d \xe3\x81\xa4 \xe3\x81\xad \xe3\x81\xaa \xe3\x82\x89 \xe3\x82\x80 \xe3\x81\x86 \xe3\x82\x90 \xe3\x81\xae \xe3\x81\x8a \xe3\x81\x8f \xe3\x82\x84 \xe3\x81\xbe \xe3\x81\x91 \xe3\x81\xb5 \xe3\x81\x93 \xe3\x81\x88 \xe3\x81\xa6 \xe3\x81\x82 \xe3\x81\x95 \xe3\x81\x8d \xe3\x82\x86 \xe3\x82\x81 \xe3\x81\xbf \xe3\x81\x97 \xe3\x82\x91 \xe3\x81\xb2 \xe3\x82\x82 \xe3\x81\x9b \xe3\x81\x99)],\n    "HALFWIDTH KATAKANA IROHA" =>\n        [qw(\xef\xbd\xb2 \xef\xbe\x9b \xef\xbe\x8a \xef\xbe\x86 \xef\xbe\x8e \xef\xbe\x8d \xef\xbe\x84 \xef\xbe\x81 \xef\xbe\x98 \xef\xbe\x87 \xef\xbe\x99 \xef\xbd\xa6 \xef\xbe\x9c \xef\xbd\xb6 \xef\xbe\x96 \xef\xbe\x80 \xef\xbe\x9a \xef\xbd\xbf \xef\xbe\x82 \xef\xbe\x88 \xef\xbe\x85 \xef\xbe\x97 \xef\xbe\x91 \xef\xbd\xb3 \xef\xbe\x89 \xef\xbd\xb5 \xef\xbd\xb8 \xef\xbe\x94 \xef\xbe\x8f \xef\xbd\xb9 \xef\xbe\x8c \xef\xbd\xba \xef\xbd\xb4 \xef\xbe\x83 \xef\xbd\xb1 \xef\xbd\xbb \xef\xbd\xb7 \xef\xbe\x95 \xef\xbe\x92 \xef\xbe\x90 \xef\xbd\xbc \xef\xbe\x8b \xef\xbe\x93 \xef\xbd\xbe \xef\xbd\xbd)],\n\n    "HANGUL CHOSUNG" =>\n         [qw(\xe3\x84\xb1 \xe3\x84\xb4 \xe3\x84\xb7 \xe3\x84\xb9 \xe3\x85\x81 \xe3\x85\x82 \xe3\x85\x85 \xe3\x85\x87 \xe3\x85\x88 \xe3\x85\x8a \xe3\x85\x8b \xe3\x85\x8c \xe3\x85\x8d \xe3\x85\x8e)],\n    "HANGUL GANADA" =>\n         [qw(\xea\xb0\x80 \xeb\x82\x98 \xeb\x8b\xa4 \xeb\x9d\xbc \xeb\xa7\x88 \xeb\xb0\x94 \xec\x82\xac \xec\x95\x84 \xec\x9e\x90 \xec\xb0\xa8 \xec\xb9\xb4 \xed\x83\x80 \xed\x8c\x8c \xed\x95\x98)],\n    "CHINESE ZODIAC 10" =>\n         [qw(\xe7\x94\xb2 \xe4\xb9\x99 \xe4\xb8\x99 \xe4\xb8\x81 \xe6\x88\x8a \xe5\xb7\xb1 \xe5\xba\x9a \xe8\xbe\x9b \xe5\xa3\xac \xe7\x99\xb8)],\n    "CHINESE ZODIAC 12" =>\n         [qw(\xe5\xad\x90 \xe4\xb8\x91 \xe5\xaf\x85 \xe5\x8d\xaf \xe8\xbe\xb0 \xe5\xb7\xb3 \xe5\x8d\x88 \xe6\x9c\xaa \xe7\x94\xb3 \xe9\x85\x89 \xe6\x88\x8d \xe4\xba\xa5)],\n\n    "ZODIAC" => [qw(\xe2\x99\x88 \xe2\x99\x89 \xe2\x99\x8a \xe2\x99\x8b  \xe2\x99\x8c  \xe2\x99\x8d  \xe2\x99\x8e  \xe2\x99\x8f  \xe2\x99\x90  \xe2\x99\x91  \xe2\x99\x92  \xe2\x99\x93  )],\n\n);\n\nfor my $a (\\%Alphabet) {\n\n    $$a{da} = $$a{no};\n    $$a{fi} = $$a{no};\n\n    $$a{de} = $$a{en};\n    $$a{fr} = $$a{en};\n    $$a{pt} = $$a{en};\n}\n\n\n1;\n
Run Code Online (Sandbox Code Playgroud)\n\n

不过,这肯定足以让您开始。

\n