小编lea*_*n10的帖子

机器学习:根据独立变量的影响规范化目标变量

我有一个数据集,其中包含如下所述的驾驶员旅行信息.我的目标是提出一个新的里程或调整里程,考虑到驾驶员携带的负载和他/她驾驶的车辆.因为我们发现里程和负荷之间存在负相关关系.因此,您携带的负载越多,您可能获得的里程越少.此外,车辆类型也可能影响您的表现.在某种程度上,我们正在尝试将里程标准化,以便给予重负荷且因此而获得较少里程的驾驶员可能不会因里程而受到惩罚.到目前为止,我已经使用线性回归和相关性来查看里程与驾驶员携带的负载之间的关系.相关系数为-.6.因变量是每加仑英里数,自变量是负载和车辆.

Drv Miles per Gal   Load(lbs)   Vehicle
A        7           1500   2016 Tundra
B        8           1300   2016 Tundra
C        8           1400   2016 Tundra
D        9           1200   2016 Tundra
E       10           1000   2016 Tundra
F        6           1500   2017 F150
G        6           1300   2017 F150
H        7           1400   2017 F150
I        9           1300   2017 F150
J       10           1100   2017 F150
Run Code Online (Sandbox Code Playgroud)

结果可能是这样的.

Drv Result-New Mileage
A   7.8
B   8.1
C   8.3
D   8.9
E   9.1
F   8.3
G   7.8
H   8
I   8.5
J …
Run Code Online (Sandbox Code Playgroud)

python statistics machine-learning linear-regression correlation

7
推荐指数
1
解决办法
244
查看次数