如何识别scala中的表情符号?

use*_*260 6 regex string twitter scala emoji

我正在处理来自Twitter Api的推文,很多推文都有表情符号.我正在尝试跟踪最常用的表情符号,但我实际上无法识别它们.

我正在使用:https://github.com/iamcal/emoji-data来识别表情符号.

我不知道如何判断字符串是否包含表情符号.我已经尝试将正则表达式与表情符号数据"统一"字段一起使用,我试过检查字符串是否包含该字段.我真的只是不确定如何检查表情符号..任何帮助将不胜感激.

val pattern = new Regex("(${a.unified})")
(pattern findAllIn text).mkString(",")
Run Code Online (Sandbox Code Playgroud)

这是我尝试使用正则表达式.这找不到任何表情符号.我也尝试在表情符号数据的统一字段之前添加\ u,但这没有帮助.

Chr*_*ris 5

您可以使用以下正则表达式来查找表情符号字符(以及Unicode语言平面之外的其他字符):

[^\u0000-\uFFFF]

例如,我们使用以下代码从字符串中过滤出表情符号:

"some string".replaceAll("[^\u0000-\uFFFF]", "");

希望有所帮助.