命令行 MySQL 中的 Unicode 转义序列

Pau*_*ney 4 mysql unicode command-line unicode-escapes

精简版:

可以使用什么样的转义序列在命令行 mysql 中搜索 unicode 字符?

长版:

我正在寻找一种方法来从命令行在 mysql 中搜索包含 unicode 序列 U+200B 的记录的列。我不知道使用哪种逃生方法。我已经尝试过 \ u200Bx200B,甚至我终于找到了一个建议使用 _utf8 语法的博客。这将在命令行上生成字符:

select _utf8 x'200B';
Run Code Online (Sandbox Code Playgroud)

现在我被困在试图让它在“LIKE”查询中工作。

这会生成字符,但是 % 放在 LIKE 部分时似乎失去了它们的特殊含义:

select _utf8 x'0025200B0025';
Run Code Online (Sandbox Code Playgroud)

我也尝试了 concat 但它也不起作用:

select concat('%', _utf8 x'200B', '%');
Run Code Online (Sandbox Code Playgroud)

更多背景:

我有一些数据中包含零宽​​度空格字符 (zwsp),Unicode Point U+200B。这通常是由在其输出中使用 zwsp 的网站复制/粘贴引起的。对于大多数 unicode 字符,我可以将字符粘贴到终端中(或使用键码创建它),但由于这个字符是不可见的,因此更具挑战性。我可以创建一个生成“%%”序列的文件并将其复制/粘贴到终端,它会工作,但它会使我的命令历史记录和终端输出变得混乱。我认为在 MySQL 中有一种直接的方法可以做到这一点,但到目前为止我还不够。

提前致谢,

- 保罗伯尼

bob*_*nce 5

select _utf8 x'0025200B0025';
Run Code Online (Sandbox Code Playgroud)

那不是 UTF-8,而是 UTF-16/UCS-2。您也许可以说SELECT _ucs2 0x0025200B0025您的 MySQL 副本是否支持 UCS-2。

否则,UTF-8 中的字节序列编码字符 U+200B 将是 0xE2、0x80、0x8B:

select 0xE2808B;
Run Code Online (Sandbox Code Playgroud)