为什么使用make_friedman1?

2 machine-learning

我已经开始学习 ML,并对 make_friedman1 感到困惑。它极大地提高了我的准确性,并增加了数据大小。但是数据不一样了,用了这个函数之后数据就变了。弗里德曼!实际上呢?

小智 5

如果这里询问的 make_friedman1 是 sklearn.datasets 中的函数,那么它就是生成 \xe2\x80\x9cFriedman #1\xe2\x80\x9d 回归问题的函数。这里的输入是均匀分布在区间 [0,1] 上的 10 个自变量,实际使用了这 10 个中的 5 个。输出是根据以下公式创建的:

\n\n
y = 10 sin(\xcf\x80 x1 x2) + 20 (x3 - 0.5)^2 + 10 x4 + 5 x5 + e\n
Run Code Online (Sandbox Code Playgroud)\n\n

其中 e 是 N(0,sd)

\n\n

引用弗里德曼的原始论文,多元自适应回归样条::

\n\n
\n

提出了一种高维数据灵活回归建模的新方法。该模型采用乘积样条基函数展开的形式,其中基函数的数量以及与每个基函数相关的参数(乘积度和节点位置)由数据自动确定。该过程的动机是回归的递归分区方法,并且具有其有吸引力的特性。然而,与递归划分不同,此方法生成具有连续导数的连续模型。它具有更强大的功能和灵活性,可以对几乎相加的关系或最多涉及几个变量的交互进行建模

\n
\n\n

样条曲线将许多多项式曲线首尾相连以形成新的平滑曲线。

\n