小编Cla*_*dia的帖子

如何使用整洁的文本使用双字母和三元组

我正在尝试使用tidytext同时使用二元组和三元组.我可以使用什么代码来代替2和3个单词.

这是仅使用bigrams的代码:

library(tidytext)
library(janeaustenr)

austen_bigrams <- austen_books() %>%
  unnest_tokens(bigram, text, token = "ngrams", n = 2)

austen_bigrams
Run Code Online (Sandbox Code Playgroud)

r token tidytext

5
推荐指数
1
解决办法
2268
查看次数

标签 统计

r ×1

tidytext ×1

token ×1