Keras Sequential 模型的多个嵌入层

Eri*_*oda 5 python keras keras-layer

我正在使用 Keras(tensorflow 后端)并且想知道如何将多个嵌入层添加到 Keras Sequential 模型中。

更具体地说,我的数据集中有几列具有分类值,并且我已经考虑使用单热编码,但已确定分类项目的数量为数百,导致大量且过于稀疏的列集。在寻找解决方案时,我发现 Keras 的嵌入层似乎非常优雅地解决了这个问题。但是,大多数示例(和 Keras 文档)说明了一个非常简单的情况,其中包含一个 Embedding 层。

不幸的是,我不知道如何将多个 Embedding 层作为输入集成到单个模型中。

我的代码看起来像这样,但它不起作用,我猜测多个 Embedding 层按顺序操作(第一个 Embedding 层输入第二个,依此类推)而不是模型的多个输入源:

model = Sequential()
model.add(Embedding(500, 64, input_length=10))  # categorical col 1
model.add(Embedding(100, 64, input_length=10))  # categorical col 2
model.add(Embedding(500, 64, input_length=10))  # categorical col 3
model.add(Flatten... 
model.add(Dense...
Run Code Online (Sandbox Code Playgroud)

我的问题是如何建立 Keras Sequential 模型,以便能够使用上面显示的三个嵌入层。第一层和最后一层之间的具体内容:

model = Sequential()
#
# What goes here?
#
model.add(Dense...
Run Code Online (Sandbox Code Playgroud)

我是在正确的轨道上,还是我的方法不正确,我需要以不同的方式建立模型?任何建议/示例表示赞赏!

nur*_*ric 8

如果您切换到功能 API,这可以轻松完成,请先阅读。然后,您可以构建一个具有代表不同列的多个输入的模型:

col1, col2, col3 = Input(shape=(10,)), Input(shape=(10,)), ...
col1_embeded = Embedding(500, 64)(col1)
col2_embedded = Embedding(100, 64)(col2)
# ...
Run Code Online (Sandbox Code Playgroud)

这些层的要点是构建计算图的可调用对象。例如,您还可以通过简单地使用相同的嵌入层在列之间共享嵌入层。

  • 谢谢 - 我看到了这种方法并且它确实有效,但是由于易读性和简单性(并不是说有很大的不同),我希望使用另一种方法(“model.add”)。如果几天后没有答案,我可能会回到你的方法。 (2认同)