您好,我正在尝试使用 python 2.7 在下载的推文中查找所有表情符号
我已经尝试使用以下代码:
import os
import codecs
import emoji
from nltk.tokenize import word_tokenize
def extract_emojis(token):
emoji_list = []
if token in emoji.UNICODE_EMOJI:
emoji_list.append(token)
return emoji_list
for tweet in os.listdir(tweets_path):
with codecs.open(tweets_path+tweet, 'r', encoding='utf-8') as input_file:
line = input_file.readline()
while line:
line = word_tokenize(line)
for token in line:
print extract_emojis(token)
line = input_file.readline()
Run Code Online (Sandbox Code Playgroud)
但是我只得到空列表,而不是表情符号。如果我收到以下推文
schuld van de sossen SP.a: wij hebben niks gedaan Groen: we gaan energie VERBIEDEN!
Run Code Online (Sandbox Code Playgroud)
代码的输出是
[]
Run Code Online (Sandbox Code Playgroud)
而不是所需的输出:
[, ]
Run Code Online (Sandbox Code Playgroud)
有什么帮助吗??谢谢!