我正在处理一些 UTF8 中的日语文本,除了非常罕见的情况外,它工作得很好。我想在 PostgreSQL 数据库中插入 UTF8 文本(也在 MySQL 上尝试过),但出现此错误:
SQLSTATE[22021]: Character not in repertoire: 7 ERREUR: invalid byte sequence for encoding "UTF8": 0xe3 0x2e 0x2e
Run Code Online (Sandbox Code Playgroud)
我检查了文本的多种方式,它似乎是正确的 UTF8(尝试使用 mb_check_encoding PHP 函数和自制的 C)。我也尝试过很多像这样的在线转换器:http : //encoder.mattiasgeniar.be/index.php
无论如何,我无法检测到什么字符对应于0xe3 0x2e 0x2e
这是日语文本(由 Facebook Graph API 以 UTF8 格式提供):http : //pasted.co/0eaea393
我已经发现 3 个不同的文本(数千个)在尝试插入 SQL 时出现此错误。有问题的字符每次都一样:0xe3 0x2e 0x2e
几个小时后,我现在请求你的帮助......