Seo*_*Min 10 python numpy dataframe pandas
有没有办法只获取列中特定项目的计数?
为了澄清,假设我使用:
countDat = df['country'].value_counts()
然后我会得到类似的东西:
Australia  35
Brazil 32
USA 93
... 等等
有没有办法只提取巴西的数量?我只需要从countDat.
我知道countDat[1]会给巴西,但有没有办法通过关键的“巴西”来搜索它?
一种方法是下拉到numpy:
res = (df['country'].values == 'Brazil').sum()
有关类似问题的基准测试结果,请参见此处。
如果您使用Categorical Data,您应该会看到更好的性能,这也有其他好处。