我有一个数据集,其中包含如下所述的驾驶员旅行信息.我的目标是提出一个新的里程或调整里程,考虑到驾驶员携带的负载和他/她驾驶的车辆.因为我们发现里程和负荷之间存在负相关关系.因此,您携带的负载越多,您可能获得的里程越少.此外,车辆类型也可能影响您的表现.在某种程度上,我们正在尝试将里程标准化,以便给予重负荷且因此而获得较少里程的驾驶员可能不会因里程而受到惩罚.到目前为止,我已经使用线性回归和相关性来查看里程与驾驶员携带的负载之间的关系.相关系数为-.6.因变量是每加仑英里数,自变量是负载和车辆.
Drv Miles per Gal Load(lbs) Vehicle
A 7 1500 2016 Tundra
B 8 1300 2016 Tundra
C 8 1400 2016 Tundra
D 9 1200 2016 Tundra
E 10 1000 2016 Tundra
F 6 1500 2017 F150
G 6 1300 2017 F150
H 7 1400 2017 F150
I 9 1300 2017 F150
J 10 1100 2017 F150
Run Code Online (Sandbox Code Playgroud)
结果可能是这样的.
Drv Result-New Mileage
A 7.8
B 8.1
C 8.3
D 8.9
E 9.1
F 8.3
G 7.8
H 8
I 8.5
J …Run Code Online (Sandbox Code Playgroud) python statistics machine-learning linear-regression correlation