什么是德语最好的MySQL排序规则

Question

什么是德语最好的MySQL排序规则

我正在用德语建立一个网站,所以我将使用类似的字符ä, ü, ß,那么你有什么建议？

Answer 1

作为字符集,如果可以,绝对是UTF-8.

作为整理 - 对于具有特殊字符的语言来说,这有点令人讨厌.有各种类型的排序规则.他们都可以存储所有的变形金刚和其他角色,但他们在比较中对待变音符号的方式不同,即是否

u = ü

Run Code Online (Sandbox Code Playgroud)

是真还是假; 并且在排序中(在字母表中,变音符号位于排序顺序中).

长话短说,你最好的选择是

utf8_unicode_ci

它允许不区分大小写的搜索; 它把ß作为ss并使用DIN-1分选.可悲的是,像所有非二进制Unicode排序规则一样,它会对待u = ü哪个是一个可怕的麻烦,因为搜索"Muller"也会返回"Müller".您将不得不通过实时设置Umlaut-aware排序来解决这个问题.

要么 utf8_bin

此排序规则没有u = ü问题,但只能进行区分大小写的搜索.

我不完全确定使用二进制排序规则是否还有其他副作用; 我在这里问了一个问题.

这个mySQL手册页很好地概述了各种排序规则及其在日常使用中带来的后果.

以下是mySQL中可用归类的概述.

Answer 2

Rol*_*and 9

为了支持完整的UTF-8标准，您必须在MySQL中使用字符集utf8mb4和排序规则utf8mb4_unicode_ci！

注意：当使用所谓的utf8字符集时，MySQL仅支持1到3个字节的字符！这就是为什么不支持现代表情符号的原因，因为它们使用4个字节！

完全支持UTF-8标准的唯一方法是将ALL 表和数据库本身的字符集和排序规则更改为utf8mb4和utf8mb4_unicode_ci。更进一步，数据库连接需要使用utf8mb4为好。

mysql服务器必须使用utf8mb4作为默认字符集，可以在/etc/mysql/conf.d/mysql.cnf中对其进行手动配置

[client]
default-character-set = utf8mb4

[mysql]
default-character-set = utf8mb4

[mysqld]
# character-set-client-handshake = FALSE  ## better not set this!
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci

Run Code Online (Sandbox Code Playgroud)

可以使用以下SQL语句将现有表迁移到utf8mb4：

ALTER TABLE <table-name> CONVERT TO 
CHARACTER SET utf8mb4 
COLLATE utf8mb4_unicode_ci;

Run Code Online (Sandbox Code Playgroud)

注意：

为了确保表列之间的任何JOIN都不会因字符集编码而变慢，必须更改所有表！
由于MySQL中索引的长度受到限制，因此每个索引行的字符总数必须乘以4字节，并且必须小于3072

启用innodb_large_prefix配置选项后，对于使用DYNAMIC和COMPRESSED行格式的InnoDB表，此长度限制增加到3072字节。

要更改数据库的字符集和默认排序规则，请运行以下命令：

ALTER DATABASE CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

Run Code Online (Sandbox Code Playgroud)

由于utf8mb4与utf8完全向后兼容，因此不应发生mojibake或其他形式的数据丢失。

归档时间：	14 年，10 月前
查看次数：	24203 次
最近记录：	6 年，10 月前