检测单个CJK字符

yar*_*ian 2 perl encoding utf-8 cjk

我有一个字符串,可以是英文单词或单个CJK字符.我保证这个字符串是UTF-8编码.我在perl脚本里面工作.

更高级别的问题是我有一个像上面描述的字符串数组.我正在加入""@array.我想知道不要在它的CJK时添加空间.

所以对于CJK我只会加入""@array.

我环顾四周但找不到这个确切的问题.

谢谢.

Abe*_*bel 6

您可以使用正则表达式\p{InCJK_Unified_Ideographs}.这是一个Unicode块(与Unicode脚本相反,它也受Perl支持,但似乎与您的问题描述不匹配).

还有一些其他候选块,如扩展A和自由基补充.这是一个完整的清单.