CNTK:序列到序列处理的损失函数

Question

CNTK:序列到序列处理的损失函数

我正在为音素对齐做一个序列到序列的模型.特别是我的火车数据看起来像配对序列(音素 - 长度),其中音素是单热矢量,长度是浮点数.所以我想用一个音素序列为模型提供信息并获得相应的长度序列.

我的网络通常是这样构建的:

model = Sequential(
    EmbeddingLayer{embeddingSize} : 
    RecurrentLSTMLayerStack {lstmDims} :
    LinearLayer{1}
)

Run Code Online (Sandbox Code Playgroud)

如果我LinearLayer{1}做对了,应该从lstmDims1 转换为1.因此,当我用长度为N的序列提供模型时,我应该得到一个长度为N的结果序列.

现在我想建立一个适当的损失函数,我认为应该是已知结果序列的元素和模型输出之间的平均差异.应该通过时间轴进行平均,以便可以管理不同长度的序列.

我打算做点什么

objectives = Input(1) #actually a sequence here as stated in the reader
result = model(features)
errs = Abs(objectives - result)
loss_function = ReduceMean(errs)
criterionNodes  = (loss_function)

Run Code Online (Sandbox Code Playgroud)

但在减少运营中,它明确指出

这些操作不支持减少序列.相反,您可以通过重复实现此目的.

我不确定如何使用复发来完成我的任务.我也不确定整个概念是否合适.

Answer 1

Nik*_*kis 1

您需要两个不太复杂的递归（对于第二个，我们使用“内置”操作，其实现在文件中cntk.core.bs）：

sum = errs + PastValue (0, sum, defaultHiddenActivation=0)
count = BS.Loop.Count(errs)
loss_function = sum / count

Run Code Online (Sandbox Code Playgroud)

归档时间：	9 年前
查看次数：	825 次
最近记录：	8 年，12 月前