如果可以激活多个输出,softmax层的替代品是什么？

Question

如果可以激活多个输出,softmax层的替代品是什么？

ZFT*_*rbo 4 mnist conv-neural-network keras softmax

例如,我有CNN试图从MNIST数据集中预测数字(使用Keras编写的代码).它有10个输出,形成softmax层.只有一个输出可以为真(每个数字从0到9独立):

Real: [0, 1, 0, 0, 0, 0, 0, 0, 0, 0]
Predicted: [0.02, 0.9, 0.01, 0.01, 0.01, 0.01, 0.01, 0.01, 0.01, 0.01]

Run Code Online (Sandbox Code Playgroud)

由于softmax的定义,预测总和等于1.0.

假设我有一个任务,我需要对一些可能属于以下类别的对象进行分类:

Real: [0, 1, 0, 1, 0, 1, 0, 0, 0, 1]

Run Code Online (Sandbox Code Playgroud)

所以我需要以其他方式规范化.我需要在范围[0,1]上给出值的函数,其总和可以大于1.

我需要这样的东西:

Predicted: [0.1, 0.9, 0.05, 0.9, 0.01, 0.8, 0.1, 0.01, 0.2, 0.9]

Run Code Online (Sandbox Code Playgroud)

每个数字是对象属于给定类别的概率.之后,我可以使用像0.5这样的阈值来区分给定对象所属的类别.

出现以下问题:

那么哪个激活功能可用于此？
可能这个功能已经存在于Keras？
在这种情况下,您可以提出一些其他预测方法吗？

Answer 1

gin*_*nge 6

您的问题是多标签分类之一,在Keras的上下文中,我们将对此进行讨论,例如:https://github.com/fchollet/keras/issues/741

简而言之,keras中建议的解决方案是用sigmoid层替换softmax层,并使用binary_crossentropy作为成本函数.

该线程的一个例子:

# Build a classifier optimized for maximizing f1_score (uses class_weights)

clf = Sequential()

clf.add(Dropout(0.3))
clf.add(Dense(xt.shape[1], 1600, activation='relu'))
clf.add(Dropout(0.6))
clf.add(Dense(1600, 1200, activation='relu'))
clf.add(Dropout(0.6))
clf.add(Dense(1200, 800, activation='relu'))
clf.add(Dropout(0.6))
clf.add(Dense(800, yt.shape[1], activation='sigmoid'))

clf.compile(optimizer=Adam(), loss='binary_crossentropy')

clf.fit(xt, yt, batch_size=64, nb_epoch=300, validation_data=(xs, ys), class_weight=W, verbose=0)

preds = clf.predict(xs)

preds[preds>=0.5] = 1
preds[preds<0.5] = 0

print f1_score(ys, preds, average='macro')

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，12 月前
查看次数：	2904 次
最近记录：	8 年，12 月前