小编Lui*_*uis的帖子

使用 tm 包删除 R 中的表情符号

我正在使用 tm 包来清理 Twitter 语料库。但是,该软件包无法清理表情符号。

\n\n

这是复制的代码:

\n\n
July4th_clean <- tm_map(July4th_clean, content_transformer(tolower))\nError in FUN(content(x), ...) : invalid input 'RT ElleJohnson Love of country is encircling the globes \xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd\xef\xbf\xbd july4thweekend July4th FourthOfJuly IndependenceDay NotAvailableOnIn' in 'utf8towcs'\n
Run Code Online (Sandbox Code Playgroud)\n\n

有人可以指出我使用 tm 包删除表情符号的正确方向吗?

\n\n

谢谢你,

\n\n

路易斯

\n

r emoticons sentiment-analysis tm

4
推荐指数
1
解决办法
1万
查看次数

标签 统计

emoticons ×1

r ×1

sentiment-analysis ×1

tm ×1