是否有特定范围的unicode代码点可以检查emojis?

Eri*_*ner 9 python unicode python-2.7

表情符号是否占据明确的unicode范围?

并且,有没有一种确定的方法来检查代码点是否是python 2.7中的表情符号?

我似乎无法找到任何相关信息.有几个消息来源指出了这个范围:

\U0001f600-\U0001f650
Run Code Online (Sandbox Code Playgroud)

但是,例如,有代码点

\U0001f918
Run Code Online (Sandbox Code Playgroud)

超出此范围.

谢谢.

Ign*_*ams 5

regex支持通过Unicode属性进行匹配,但遗憾的是它不支持表情符号特有的属性.如果是这样,找到它们就会像下面这样简单:

>>> regex.match(ur'\P{Emoji=yes}', u'') # NOTE: Doesn't (yet) work
Run Code Online (Sandbox Code Playgroud)

与此同时,这是unicode.org的表情符号表.

  • 请注意,这包括"#"和"*"等字符,因为更多字符的"表情符号=是"比您预期的要多.对'Emoji_Presentation = yes`进行过滤更具选择性,但它可能会排除您认为是表情符号的字符,例如RIGHT ANGER BUBBLE. (3认同)