我有分类问题,我想测试所有可用的算法来测试它们在解决问题时的表现.如果您知道除下面列出的分类算法以外的任何分类算法,请在此处列出.
GradientBoostingClassifier()
DecisionTreeClassifier()
RandomForestClassifier()
LinearDiscriminantAnalysis()
LogisticRegression()
KNeighborsClassifier()
GaussianNB()
ExtraTreesClassifier()
BaggingClassifier()
Run Code Online (Sandbox Code Playgroud)
非常感谢您的帮助.
python algorithm classification machine-learning scikit-learn
我有一个由小时和分钟组成的 4 位字符串格式的时间。例如,1608 需要转换为 => 16:08
数据采用熊猫数据框的形式,我尝试过:
A st_time
1 23 1608
2 12 1635
3 18 1654
4 38 1705
Run Code Online (Sandbox Code Playgroud)
我尝试使用:
df.st_time.to_datetime().strftime('%h-%m')
Run Code Online (Sandbox Code Playgroud)
但是,它会引发错误。
AttributeError: 'Series' object has no attribute 'to_datetime'
Run Code Online (Sandbox Code Playgroud) 我想在pandas数据帧上使用groupby,但我希望得到一些列的平均值和其他列的总和.假设我们有以下数据帧:
ID A B C
1 1 1 0
1 2 3 1
1 3 6 1
4 3 2 1
4 4 1 0
6 5 1 0
6 6 6 1
6 7 2 0
Run Code Online (Sandbox Code Playgroud)
我想分组ID并获得列"A"的平均值和其他列的总和(实际上我有超过40列).
我希望结果看起来像这样:
ID A B C
1 2 10 2
4 3.5 3 1
6 6 9 1
Run Code Online (Sandbox Code Playgroud)
提前致谢.
我有一个如下所示的数据框。它包含 ID 列、月份以及客户是否购买了特定产品。
ID Date Buy_Or_Not
1 2016-01 1
1 2016-02 1
1 2016-03 0
1 2016-04 1
1 2016-05 0
2 2016-01 1
2 2016-02 1
2 2016-03 1
2 2016-04 1
2 2016-05 0
Run Code Online (Sandbox Code Playgroud)
我想把它改造成这个样子。
ID 2016-01 2016-02 2016-03 2016-04 2016-05
1 1 1 0 1 0
2 1 1 1 1 0
Run Code Online (Sandbox Code Playgroud)
完成这项工作的任何建议。
python ×4
pandas ×3
dataframe ×2
algorithm ×1
datetime ×1
numpy ×1
python-3.x ×1
reshape ×1
scikit-learn ×1
time ×1