小编pro*_*ter的帖子

向 Pandas 数据透视表添加过滤器

我想向数据透视表添加过滤条件,如下所示:

(选择 v2 的值等于 'A')

pd.pivot_table(df,index=['v1'],columns=['v2'=='A'],values=['v3'],aggfunc='count')
Run Code Online (Sandbox Code Playgroud)

那可能吗?

python pivot-table pandas

5
推荐指数
2
解决办法
3万
查看次数

if else在pandas数据帧中起作用

我正在尝试在数据帧上应用if条件,但我遗漏了一些东西(错误:系列的真值是不明确的.使用a.empty,a.bool(),a.item(),a. any()或a.all().)

raw_data = {'age1': [23,45,21],'age2': [10,20,50]}
df = pd.DataFrame(raw_data, columns = ['age1','age2'])

def my_fun (var1,var2,var3):
if (df[var1]-df[var2])>0 :
    df[var3]=df[var1]-df[var2]
else:
    df[var3]=0
print(df[var3])

my_fun('age1','age2','diff')
Run Code Online (Sandbox Code Playgroud)

python if-statement dataframe pandas

5
推荐指数
3
解决办法
4万
查看次数

python中的随机森林:分类问题的最终概率

在分类问题中,RF 分类器根据多数投票给出最终响应,例如对某个事件是或否。

另一方面,我还可以看到一个带有事件最终概率的向量,例如 0,83。如果我有 1000 个估计量,这个概率是如何计算的,是每棵树的 1000 个概率的平均值吗?

clf = RandomForestClassifier(max_depth = 4, min_samples_split=2, n_estimators = 200, random_state = 1) 
clf.fit(train[columns], train["churn"]) 
predictions = clf.predict(test[columns]) 
predicted_probs = clf.predict_proba(test[columns]) 
print(predicted_probs) 
test = pd.concat([test, pd.DataFrame(predicted_probs, columns=['Col_0', 'Col_1'])], axis=1) 
Run Code Online (Sandbox Code Playgroud)

python classification probability random-forest scikit-learn

4
推荐指数
1
解决办法
4400
查看次数