我正在引用keras 文档来构建一个网络,它以嵌入和其他一些重要功能的形式接受多个输入.但是如果我们已经定义了主要损失,我不明白辅助损失的确切影响.
在这里,我们插入辅助损耗,即使模型中的主要损失会更高,也可以平滑地训练LSTM和嵌入层.
如文档中所述,我假设它有助于在嵌入/之前定义的任何其他层上顺利训练.我的问题是,如何确定辅助损失的权重.
我们编译模型并为辅助损失分配0.2的权重.要为每个不同的输出指定不同的loss_weights或loss,可以使用列表或字典.
如果有人能够解释如何确定损失权重以及辅助损失权重的更高/更低值如何影响模型训练和预测,我将非常感激.