我们可以使用自动编码器来处理文本数据

siv*_*iya 6 autoencoder

我正在做我的基于医疗保健的项目.我将训练我的自动编码器的症状和疾病,即我的输入是文本形式.那会有用吗?(我正在使用Rstudio).请任何人帮助我

小智 6

您必须将文本转换为矢量/数字 s.要做到这一点,像Bag of words,Tf-Idf这样的传统方法将有所帮助,但最新的神经词嵌入如Word2Vec,RNN语言模型等是获得文本数字表示的最佳技术.请使用任何神经词嵌入技术并将文本(单词level[word2vec], document level[doc2vec])转换为数字/向量.现在这些向量带有一些维度并将此表示压缩到更小的维度,您可以使用AutoEncode r.随意询问所需的任何其他信息.尝试使用Python执行这些任务,因为它具有最新的包.