小编spa*_*h2o的帖子

如何从概念上考虑标记词和词嵌入之间的关系?

我一直在使用 JJ Allaire 的指南,在神经网络模型中使用词嵌入进行文本处理(https://jjallaire.github.io/deep-learning-with-r-notebooks/notebooks/6.1-using-word-embeddings.nb .html)。我对模型如何将标记化的单词序列 (x_train) 与使用整个数据集(而不仅仅是训练数据)定义的词嵌入相关联感到困惑。有没有办法概念化单词标记如何映射到单词嵌入?否则,像“king”这样的词如何映射到词嵌入(例如使用 Glove 获得)。我说的是这些代码块之间的关系:

#building model 
history <- model %>% fit(
 x_train, y_train,
 epochs = 20,
 batch_size = 32,
 validation_data = list(x_val, y_val)
)

#relating model to word embeddings
model <- keras_model_sequential() %>% 
layer_embedding(input_dim = max_words, output_dim = embedding_dim, 
              input_length = maxlen) %>% 
layer_flatten() %>% 
layer_dense(units = 32, activation = "relu") %>% 
layer_dense(units = 1, activation = "sigmoid")

get_layer(model, index = 1) %>% 
 set_weights(list(embedding_matrix)) %>% 
 freeze_weights()
Run Code Online (Sandbox Code Playgroud)

来自 x_train 的标记化单词如何链接回 embedding_matrix 中的单词(特别是如果嵌入层是针对所有数据进行训练的)?

nlp r text-analysis keras

3
推荐指数
2
解决办法
2138
查看次数

删除 ggsurvplot R 中的百分号

我有以下代码,我用百分比而不是比例构建生存曲线。我的生存时间也突破了数十倍。我想从下面的图中删除百分比符号,因为我想将其添加到图的 ylab 标题中。

library(survival)
library(survminer)
data(lung)
fit <- survfit(Surv(time, status) ~sex, data = lung)
ggsurvplot(fit, risk.table = TRUE, axes.offset = FALSE,
           break.y = 0.10,
           surv.scale = c("percent"),
           xlim = c(0, 1050))
Run Code Online (Sandbox Code Playgroud)

r survival-analysis survival

3
推荐指数
1
解决办法
1531
查看次数

标签 统计

r ×2

keras ×1

nlp ×1

survival ×1

survival-analysis ×1

text-analysis ×1