我正在做我的基于医疗保健的项目.我将训练我的自动编码器的症状和疾病,即我的输入是文本形式.那会有用吗?(我正在使用Rstudio).请任何人帮助我
小智 6
您必须将文本转换为矢量/数字 s.要做到这一点,像Bag of words,Tf-Idf这样的传统方法将有所帮助,但最新的神经词嵌入如Word2Vec,RNN语言模型等是获得文本数字表示的最佳技术.请使用任何神经词嵌入技术并将文本(单词level[word2vec], document level[doc2vec])转换为数字/向量.现在这些向量带有一些维度并将此表示压缩到更小的维度,您可以使用AutoEncode r.随意询问所需的任何其他信息.尝试使用Python执行这些任务,因为它具有最新的包.
| 归档时间: |
|
| 查看次数: |
3176 次 |
| 最近记录: |