小编Bin*_*min的帖子

从字符串中删除表情符号在某些情况下不起作用

我正在处理从谷歌大查询收到的一些数据,其中数据中包含一些特殊的表情符号。我有一个删除表情符号的代码,但它不适用于以下特定表情符号。

删除所有表情符号但不适用于以下情况的示例代码。

使用版本 Python 3.9

from re import UNICODE, compile
emoji_pattern = compile("["
                        u"\U0001F600-\U0001F64F"  # emoticons
                        u"\U0001F300-\U0001F5FF"  # symbols & pictographs
                        u"\U0001F680-\U0001F6FF"  # transport & map symbols
                        u"\U0001F1E0-\U0001F1FF"  # flags (iOS)
                        u"\U0001F1F2-\U0001F1F4"  # Macau flag
                        u"\U0001F1E6-\U0001F1FF"  # flags
                        u"\U0001F600-\U0001F64F"
                        u"\U00002702-\U000027B0"
                        u"\U000024C2-\U0001F251"
                        u"\U0001f926-\U0001f937"
                        u"\U0001F1F2"
                        u"\U0001F1F4"
                        u"\U0001F620"
                        u"\u200d"
                        u"\u2640-\u2642"
                        "]+", flags=UNICODE)

# Works for this one 
data = 'support.google.co.uk/s/.'
result = emoji_pattern.subn(r'', data)
# result --> ('support.google.co.uk/s/.', 1)

# Doesn't work in this case
data = 'www.google.co.uk/?'
result = emoji_pattern.subn(r'', data)
# …
Run Code Online (Sandbox Code Playgroud)

python python-3.9

4
推荐指数
1
解决办法
1550
查看次数

标签 统计

python ×1

python-3.9 ×1