小编pro*_*ter的帖子

向 Pandas 数据透视表添加过滤器

我想向数据透视表添加过滤条件，如下所示：

（选择 v2 的值等于 'A'）

pd.pivot_table(df,index=['v1'],columns=['v2'=='A'],values=['v3'],aggfunc='count')

Run Code Online (Sandbox Code Playgroud)

那可能吗？

python pivot-table pandas

pro*_*ter

2017 04-05

5
推荐指数

2
解决办法

3万
查看次数

if else在pandas数据帧中起作用

我正在尝试在数据帧上应用if条件,但我遗漏了一些东西(错误:系列的真值是不明确的.使用a.empty,a.bool(),a.item(),a. any()或a.all().)

raw_data = {'age1': [23,45,21],'age2': [10,20,50]}
df = pd.DataFrame(raw_data, columns = ['age1','age2'])

def my_fun (var1,var2,var3):
if (df[var1]-df[var2])>0 :
    df[var3]=df[var1]-df[var2]
else:
    df[var3]=0
print(df[var3])

my_fun('age1','age2','diff')

Run Code Online (Sandbox Code Playgroud)

python if-statement dataframe pandas

pro*_*ter

lucky-day

5
推荐指数

3
解决办法

4万
查看次数

python中的随机森林：分类问题的最终概率

在分类问题中，RF 分类器根据多数投票给出最终响应，例如对某个事件是或否。

另一方面，我还可以看到一个带有事件最终概率的向量，例如 0,83。如果我有 1000 个估计量，这个概率是如何计算的，是每棵树的 1000 个概率的平均值吗？

clf = RandomForestClassifier(max_depth = 4, min_samples_split=2, n_estimators = 200, random_state = 1) 
clf.fit(train[columns], train["churn"]) 
predictions = clf.predict(test[columns]) 
predicted_probs = clf.predict_proba(test[columns]) 
print(predicted_probs) 
test = pd.concat([test, pd.DataFrame(predicted_probs, columns=['Col_0', 'Col_1'])], axis=1)

Run Code Online (Sandbox Code Playgroud)

python classification probability random-forest scikit-learn

pro*_*ter

2021 11-29

4
推荐指数

1
解决办法

4400
查看次数