标签: udpipe

使 udpipe_annotate() 更快

我目前正在编写一个文本挖掘文档,我想从文本中提取相关关键字(请注意,我有很多很多文本文档)。

我正在使用 udpipe 包。一个很棒的 Vignette 在线 ( http://bnosac.be/index.php/blog/77-an-overview-of-keyword-extraction-techniques )。一切正常,但是当我运行代码时,该部分

x <- udpipe_annotate(ud_model, x = comments$feedback)
Run Code Online (Sandbox Code Playgroud)

真的非常慢(特别是当你有很多文本时)。有人知道如何更快地获得这部分吗?解决方法当然没问题。

library(udpipe)
library(textrank)
## First step: Take the Spanish udpipe model and annotate the text. Note: this takes about 3 minutes

data(brussels_reviews)
comments <- subset(brussels_reviews, language %in% "es")
ud_model <- udpipe_download_model(language = "spanish")
ud_model <- udpipe_load_model(ud_model$file_model)
x <- udpipe_annotate(ud_model, x = comments$feedback) # This part is really, really slow 
x <- as.data.frame(x)
Run Code Online (Sandbox Code Playgroud)

提前谢谢了!

r keyword tm udpipe

4
推荐指数
1
解决办法
1558
查看次数

标签 统计

keyword ×1

r ×1

tm ×1

udpipe ×1