pyt*_*nda 5 python python-2.7 pandas
我有一列网站:['加拿大','美国','中国'....]
每个站点在SITE列中多次出现,并且每个实例旁边都是true或false值.
INDEX | VALUE | SITE
0 | True | Canada
1 | False | Canada
2 | True | USA
3 | True | USA
Run Code Online (Sandbox Code Playgroud)
它继续下去.
目标1:我想为每个站点找到VALUE列的百分比为True.
目标2:我想返回一个网站列表,其中VALUE列中的%True大于10%.
我如何使用groupby来实现这一目标?我只知道如何使用groupby找到每个网站的平均值,这对我没有帮助.
像这样的东西:
In [13]: g = df.groupby('SITE')['VALUE'].mean()
In [14]: g[g > 0.1]
Out[14]:
SITE
Canada 0.5
USA 1.0
Run Code Online (Sandbox Code Playgroud)