有人能解释人工神经网络吗?

8 artificial-intelligence machine-learning neural-network

根据维基百科(我知道这是一个不好的来源)神经网络由...组成

  • A神经元的输入层

  • 多个(B)隐藏层,每个层由C神经元组成.

  • "D"神经元的输出层.

我理解输入和输出层的含义.

我的问题是如何确定最佳的层数和每层神经元?

  • 增加"B"的优势/劣势是什么?
  • 增加"C"的优势/劣势是什么?
  • 增加"B"与"C"之间有什么区别?

它只是时间量(处理能力的限制)还是会使网络更深入地限制结果质量,我应该更多地关注深度(更多层)还是广度(每层更多神经元)?

Yav*_*var 8

答案1.一层将模拟大多数问题,或者最多可以使用两层.

答案2.如果使用的神经元数量不足,网络将无法对复杂数据进行建模,因此产生的拟合效果会很差.如果使用太多神经元,则训练时间可能变得过长,并且更糟糕的是,网络可能过度拟合数据.当过度拟合 $发生时,网络将开始模拟数据中的随机噪声.结果是该模型非常适合训练数据,但它很难概括为新的,看不见的数据.必须使用验证来测试这一点.

$什么是过度拟合?

在统计中,当统计模型描述随机误差或噪声而不是基础关系时,会发生过度拟合.过度拟合通常在模型过于复杂时发生,例如相对于观察数量具有太多参数.过度拟合的模型通常具有较差的预测性能,因为它可能夸大数据中的微小波动.过度拟合的概念在机器学习中很重要.通常,使用一组训练示例来训练学习算法,即,期望输出已知的示例性情况.假设学习者达到一种状态,在该状态下,学习者也能够预测其他示例的正确输出,从而推广到训练期间未呈现的情况(基于其归纳偏差).然而,特别是在学习执行时间过长或者训练样例很少的情况下,学习者可以调整到训练数据的非常特定的随机特征,其与目标函数没有因果关系.在这个过度拟合的过程中,训练样例的性能仍然会提高,而看不见的数据的性能会变差.

答案3.阅读答案1和2.

维基百科上的监督学习文章(http://en.wikipedia.org/wiki/Supervised_learning)将让您更深入地了解哪些因素对包括神经网络在内的任何监督学习系统都非常重要.文章讨论了输入空间的维度,训练数据的数量,噪声等.