有没有办法知道Unicode字符串是否包含Python中的任何中文/日文字符?

Dr.*_*pha 6 python

我在Python中有一个Unicode字符串.我正在寻找一种方法来确定字符串中是否有任何中文/日文字符.如果可能的话,能够找到这些角色会更好.

这似乎与语言检测问题有点不同.我的字符串可以是英文和中文文本的混合.

我的代码可以访问Internet.

比尔盖*_*尔盖子 3

您可以使用此正则表达式[\u2E80-\u9FFF]来匹配 CJK 字符。

  • 这几乎是正确的,但并不完全正确。根据官方Unicode数据库[Scripts.txt](http://www.unicode.org/Public/UNIDATA/Scripts.txt),汉字涵盖`2E80`到`9FCC`的**子集** ,以及“F900”到“FAD9”和“20000”到“2FA1D”。但子集有点复杂...... (4认同)