Rom*_*siv 5 python pivot-table nan dataframe pandas
我可以使用 pandas hub_table 聚合具有缺失值的列,并将这些缺失值作为单独的类别包含在内吗?
In:
df = pd.DataFrame({'a': pd.Series(['X', 'X', 'Y', 'Y', 'N', 'N'], dtype='category'),
'b': pd.Series([None, None, 'd', 'd', 'd', 'd'], dtype='category')})
Out:
a b
0 X NaN
1 X NaN
2 Y d
3 Y d
4 N d
5 N d
In:
df.groupby('a')['b'].apply(lambda x: x.value_counts(dropna=False)).unstack(1)
Out:
NaN d
a
N NaN 2.0
X 2.0 0.0
Y NaN 2.0
Run Code Online (Sandbox Code Playgroud)
我可以使用 pandas hub_table 获得相同的结果吗?如果是的话怎么办?谢谢。
由于某些未知原因,在计算值时dtype="category"不起作用。将它们转换为常规字符串可以启用常规.pivot_table()NaNpivot_table(aggfunc="size")
df.astype(str).pivot_table(index="a", columns="b", aggfunc="size")
Run Code Online (Sandbox Code Playgroud)
b d nan
a
N 2.0 NaN
X NaN 2.0
Y 2.0 NaN
Run Code Online (Sandbox Code Playgroud)
人们可以选择将s.fillna(0)替换为snan0
| 归档时间: |
|
| 查看次数: |
598 次 |
| 最近记录: |