相关疑难解决方法(0)

我确信这里很多人都知道，处理德语元音变音和 UTF8 排序规则至少可以说是有问题的。a = \xc3\xa4像, o = \xc3\xb6,之类的东西u = \xc3\xbc不仅能够影响结果的排序顺序，而且还能影响实际结果。这里有一个例子，清楚地展示了简单地尝试区分名词的单数和复数版本（Bademantel- 单数，Badem\xc3\xa4ntel- 复数）会如何出错。

\n\n

CREATE TABLE keywords (\n    id INT (11) PRIMARY KEY AUTO_INCREMENT,\n    keyword VARCHAR (255) NOT NULL\n) ENGINE = MyISAM DEFAULT CHARACTER\nSET = utf8 COLLATE = utf8_unicode_ci;\n\nINSERT INTO keywords (keyword) VALUES (\'Bademantel\'), (\'Badem\xc3\xa4ntel\');\n\nSELECT * FROM keywords WHERE keyword LIKE (\'%Badem\xc3\xa4ntel%\');\n

Run Code Online (Sandbox Code Playgroud)\n\n

结果应该是

\n\n

+----+------------+\n| id | keyword    |\n+----+------------+\n|  1 | Badem\xc3\xa4ntel |\n+----+------------+\n

Run Code Online (Sandbox Code Playgroud)\n\n

但utf8_unicode_ci输出是

\n\n

+----+------------+\n| id | …

Run Code Online (Sandbox Code Playgroud)

mysql collation diacritics

作者

2014 01-06

5
推荐指数

1
解决办法

3234
查看次数

标签统计

collation ×3

mysql ×3

diacritics ×1

utf-8 ×1

UTF-8:一般？滨？Unicode的？

使用二进制排序规则有什么影响？

重新审视德语元音变音和 UTF8 排序规则

标签 统计

标签统计