如何在字符串(python,perl)中找到表情符号,unicode字符和表情符号的文本描述?

use*_*230 2 python regex unicode perl emoticons

之前已经解决了表情符号图标的检测和计数.

作为对这个问题及所提供解决方案的后续跟进,我想扩展它,将检测到的表情符号,unicode字符和表情符号链接到相应的(文本)描述:

  • 表情符号(西方和东方,例如来自维基百科的List_of_emoticons),
  • unicode字符(例如,unicode网站提供的U1F600.pdf(直接链接包含在上面提到的stackoverflow问题中),
  • 其他表情符号类型,例如来自Twitter中经常使用的表情符号列表(来自emojipedia网站的twitter-emoji-list).

是否有任何全面的解决方案可用于进行python或perl中的这种转换,类似于Swift中实现的方法?如果没有,你可以创建一个脚本,为字符串中的表情符号/表情符号提供文本描述吗?

jm6*_*666 7

使用charnames的 perl示例:

use 5.014;
use strict;
use warnings;
use utf8;
use open qw(:std :utf8);
use charnames ':full';

my @faces = split //, '';
for (@faces) {
    say sprintf "U+%05X %s %s",
        ord($_), $_, charnames::viacode(ord($_));
}
Run Code Online (Sandbox Code Playgroud)

版画

U+1F604  SMILING FACE WITH OPEN MOUTH AND SMILING EYES
U+1F600  GRINNING FACE
U+1F608  SMILING FACE WITH HORNS
Run Code Online (Sandbox Code Playgroud)