在Jupyter笔记本中使用 Python 3 。我正在尝试创建一个回归模型(方程?)来预测Eng as % of Followers变量。我会得到Media Type, Hour Created, 和Day of Week。这些都应该被视为分类变量。
这是我过去的一些数据。
Media Type Eng as % of Followers Hour Created Day of Week
0 Video 0.0136 23 Tuesday
1 Video 0.0163 22 Wednesday
2 Video 0.0163 22 Tuesday
3 Video 0.0196 22 Friday
4 Video 0.0179 20 Thursday
5 Photo 0.0087 14 Wednesday
Run Code Online (Sandbox Code Playgroud)
我已经创建了dummy variablesusing pd.get_dummies,但我不确定我做对了 - 问题特别在于Hour Created变量。它们是数字,但我希望它们被视为类别。例如,第 22 小时可能是一个性能助推器,但这不应暗示第 21 …