相关疑难解决方法(0)

tm自定义removePunctuation除了标签

我有来自twitter的推文语料库.我清理这个语料库(removeWords,tolower,删除URls),最后还想删除标点符号.

这是我的代码:

tweetCorpus <- tm_map(tweetCorpus, removePunctuation, preserve_intra_word_dashes = TRUE)
Run Code Online (Sandbox Code Playgroud)

现在的问题是,通过这样做,我也松开了#标签.有没有办法用tm_map删除标点符号但保留标签?

customization text-processing r punctuation tm

5
推荐指数
2
解决办法
4127
查看次数

标签 统计

customization ×1

punctuation ×1

r ×1

text-processing ×1

tm ×1