如何计算 pandas 中每个唯一值的出现次数

Question

如何计算 pandas 中每个唯一值的出现次数

我有一个大的 pandas 数据框，我想计算其中每个唯一值的出现次数，我尝试遵循，但需要花费大量时间和内存使用量。我怎样才能以Pythonic的方式做到这一点？

pack=[]
for index,row in packets.iterrows ():
    pack.extend(pd.Series(row).dropna().values.tolist())

unique, count= np.unique(pack, return_counts=True)
counts= np.asarray((unique, count))

Run Code Online (Sandbox Code Playgroud)

Answer 1

cs9*_*s95 6

您似乎想计算所有列的值计数。您可以将其展平为级数，删除 NaN，然后调用value_counts。这是一个示例 -

df

     a    b
0  1.0  NaN
1  1.0  NaN
2  3.0  3.0
3  NaN  4.0
4  5.0  NaN
5  NaN  4.0
6  NaN  5.0

Run Code Online (Sandbox Code Playgroud)

pd.Series(df.values.ravel()).dropna().value_counts()

5.0    2
4.0    2
3.0    2
1.0    2
dtype: int64

Run Code Online (Sandbox Code Playgroud)

另一种方法是np.unique-

u, c = np.unique(pd.Series(df.values.ravel()).dropna().values, return_counts=True)
pd.Series(c, index=u)

1.0    2
3.0    2
4.0    2
5.0    2
dtype: int64

Run Code Online (Sandbox Code Playgroud)

请注意，第一个方法按计数降序对结果进行排序，而后者则不然。

归档时间：	8 年，1 月前
查看次数：	4958 次
最近记录：	8 年，1 月前