问题是,如你所知,Unicode图表中有数千个字符,我想将所有相似的字符转换为英文字母中的字母.
例如,这里有一些转换:
?->H
?->V
?->Y
?->O
?->C
t?? ?????y --> the Family
...
Run Code Online (Sandbox Code Playgroud)
我看到有超过20个版本的字母A/a.而且我不知道如何对它们进行分类.它们看起来像大海捞针.
完整的unicode字符列表位于http://www.ssec.wisc.edu/~tomw/java/unicode.html 或http://unicode.org/charts/charindex.html.只需向下滚动即可看到字母的变化.
如何用Java转换所有这些?请帮我 :(
在Android中创建SQLite数据库时,我设置了数据库语言环境 - db.setLocale(new Locale("cz_CZ")).这是一个捷克语的地方.
SELECT语句起作用并考虑区域设置,例如:
SELECT * from table WHERE name='sctzy' COLLATE LOCALIZED
Run Code Online (Sandbox Code Playgroud)
会找到条目'ščťžý'.
但使用LIKE将失败:
SELECT * from table WHERE name LIKE '%sctzy%' COLLATE LOCALIZED
Run Code Online (Sandbox Code Playgroud)
没有返回任何行.
BTW.Android中没有java.text.Normalized类.我以为我可以用标准化的文本制作第二列,删除特殊字符,这些字符将用于搜索 - 但我缺少一个类或方法如何规范化String.
我从http://www.sqlite.org/sqlite-autoconf-3070701.tar.gz下载了sqlite
如何用icu编译sqlite?
我有一个列,其中一些元素包含重音字母.例如:Grambú
我的要求是,当我搜索"Grambu"时,我也应该在结果中获得"Grambú".
对于此要求,我尝试对该特定列使用"COLLATE NOCASE"参数.但那没有用.
当我在网上搜索解决方案时,我发现很多人建议对重音字符进行规范化,并根据它创建另一个列作为唯一选项.
这个问题还有其他更简单的解决方案吗?