sup*_*li3 2 python machine-learning gaussian scikit-learn
我知道这个参数 var_smoothing 以及如何调整它,但我想要一个数学/统计方面的解释,解释它实际上做了什么调整 - 我在网上找不到任何好的。
小智 8
高斯曲线可以用作“低通”滤波器,仅允许接近其均值的样本“通过”。在朴素贝叶斯的上下文中,假设高斯分布本质上是为更接近分布均值的样本赋予更多权重。这可能合适也可能不合适,具体取决于您要预测的内容是否遵循正态分布。
变量 var_smoothing 人为地将用户定义的值添加到分布的方差(其默认值来自训练数据集)。这实质上拓宽了(或“平滑”了)曲线并解释了更多远离分布均值的样本。