使用 python 在文本中查找表情符号

m4s*_*sh4 5 python emoji

您好,我正在尝试使用 python 2.7 在下载的推文中查找所有表情符号

我已经尝试使用以下代码:

import os
import codecs
import emoji
from nltk.tokenize import word_tokenize

def extract_emojis(token):
    emoji_list = []
    if token in emoji.UNICODE_EMOJI:
        emoji_list.append(token)
    return emoji_list

for tweet in os.listdir(tweets_path):
    with codecs.open(tweets_path+tweet, 'r', encoding='utf-8') as input_file:
        line = input_file.readline()
        while line:
            line = word_tokenize(line)
            for token in line:
                print extract_emojis(token)

            line = input_file.readline()
Run Code Online (Sandbox Code Playgroud)

但是我只得到空列表,而不是表情符号。如果我收到以下推文

schuld van de sossen  SP.a: wij hebben niks gedaan  Groen: we gaan energie VERBIEDEN!
Run Code Online (Sandbox Code Playgroud)

代码的输出是

[]
Run Code Online (Sandbox Code Playgroud)

而不是所需的输出:

[, ]
Run Code Online (Sandbox Code Playgroud)

有什么帮助吗??谢谢!