如何解释神经网络层的权重分布

Question

我设计了一个三层神经网络，其输入是来自CNN和RNN的串联特征。网络学习的权重取很小的值。对此有何合理解释？以及如何解释Tensorflow中的权重直方图和分布？有什么好的资源吗？

这是使用张量板可视化的三层神经网络的第一隐藏层的权重分布。如何解释呢？所有权重都占零值？

这是3层神经网络的第二个隐藏层的权重分布：

Answer 1

如何解释Tensorflow中的权重直方图和分布？

好吧，您可能没有意识到这一点，但是您刚刚问了ML和AI中的一百万美元问题...

模型的可解释性是当前研究（例如圣杯之类的东西）的一个非常活跃而又非常热门的领域，近来提出这一点的原因不仅仅在于深度学习模型在各种任务中的（通常是巨大的）成功。这些型号目前仅是黑匣子，我们自然对此感到不舒服...

有什么好的资源吗？

可能您所想的资源可能不完全相同，我们在这里还没有一个非常适合的主题，但是由于您提出以下问题：

《科学》杂志上最近（2017年7月）的一篇文章很好地概述了当前的状态和研究：人工智能侦探如何破解深度学习的黑匣子（没有文本链接，但使用谷歌搜索的名称和术语会有所收获）
DARPA本身目前正在运行有关可解释人工智能（XAI）的程序
在NIPS 2016上有一个关于复杂系统的可解释机器学习的研讨会

在更实际的水平上：

这些对于初学者来说应该足够了，并且可以让您对您所询问的主题有一个大致的了解...

更新（2018年10月）：在我对预测性分析-“为什么”因素的回答中，我提供了更为详细的实用资源列表。