我在 pandas 数据框中有一个数据,例如:
\ndf = \n\n X1 X2 X3 Y\n0 1 2 10 5.077\n1 2 2 9 32.330\n2 3 3 5 65.140\n3 4 4 4 47.270\n4 5 2 9 80.570\n
Run Code Online (Sandbox Code Playgroud)\n我想做多元回归分析。这里 Y 是因变量,x1、x2 和 x3 是自变量。\n每个自变量与因变量之间的相关性为:
\ndf.corr():\n\n X1 X2 X3 Y\nX1 1.000000 0.353553 -0.409644 0.896626\nX2 0.353553 1.000000 -0.951747 0.204882\nX3 -0.409644 -0.951747 1.000000 -0.389641\nY 0.896626 0.204882 -0.389641 1.000000\n
Run Code Online (Sandbox Code Playgroud)\n\xe2\x80\x8b正如我们在这里看到的,y 与 x1 具有最高的相关性,所以我选择 x1 作为第一个自变量。在这个过程中,我尝试选择与 y 具有最高部分相关性的第二个自变量。在这种情况下如何找到偏相关?
\n