nae*_*eha 2 machine-learning neural-network deep-learning tensorflow
我设计了一个三层神经网络,其输入是来自CNN和RNN的串联特征。网络学习的权重取很小的值。对此有何合理解释?以及如何解释Tensorflow中的权重直方图和分布?有什么好的资源吗?
这是使用张量板可视化的三层神经网络的第一隐藏层的权重分布。如何解释呢?所有权重都占零值?

这是3层神经网络的第二个隐藏层的权重分布:

如何解释Tensorflow中的权重直方图和分布?
好吧,您可能没有意识到这一点,但是您刚刚问了ML和AI中的一百万美元问题...
模型的可解释性是当前研究(例如圣杯之类的东西)的一个非常活跃而又非常热门的领域,近来提出这一点的原因不仅仅在于深度学习模型在各种任务中的(通常是巨大的)成功。这些型号目前仅是黑匣子,我们自然对此感到不舒服...
有什么好的资源吗?
可能您所想的资源可能不完全相同,我们在这里还没有一个非常适合的主题,但是由于您提出以下问题:
《科学》杂志上最近(2017年7月)的一篇文章很好地概述了当前的状态和研究:人工智能侦探如何破解深度学习的黑匣子(没有文本链接,但使用谷歌搜索的名称和术语会有所收获)
DARPA本身目前正在运行有关可解释人工智能(XAI)的程序
在更实际的水平上:
用于神经网络的分层相关传播(LRP)工具箱(纸张,项目页面,代码,TF Slim包装器)
这些对于初学者来说应该足够了,并且可以让您对您所询问的主题有一个大致的了解...
更新(2018年10月):在我对预测性分析-“为什么”因素的回答中,我提供了更为详细的实用资源列表。
| 归档时间: |
|
| 查看次数: |
1550 次 |
| 最近记录: |