使用 word2vec 来编码分类特征是个好主意吗?

Big*_*ian 5 nlp machine-learning categorical-data word2vec feature-engineering

我面临着一个二元预测任务,并且有一组特征,其中所有特征都是分类的。因此,一个关键的挑战是将这些分类特征编码为数字,我一直在寻找聪明的方法来做到这一点。我偶然发现了 word2vec,它主要用于 NLP,但我想知道是否可以使用它来编码我的变量,即简单地将神经网络的权重作为编码特征。

然而,我不确定这是否是一个好主意,因为在我的例子中,作为 word2vec 中的输入特征的上下文单词或多或少是随机的,这与 word2vec 最初设计的真实句子形成鲜明对比。

对此大家有什么意见、想法、建议吗?

Kaz*_*tta 4

如果您正在寻找一种将嵌入用于分类变量的方法,则应该研究实体嵌入。