相关疑难解决方法(0)

在Python中对pandas中的数据帧进行分类

给出pandas中的以下数据帧:

import numpy as np
df = pandas.DataFrame({"a": np.random.random(100), "b": np.random.random(100), "id": np.arange(100)})
Run Code Online (Sandbox Code Playgroud)

其中id是由以下组成的每个点的ID ab值,哪能仓ab成一组指定的仓(这样我可以再取中值/平均值ab每个仓中)? 对于任何给定的行,df可能具有或(或两者)的NaN值.谢谢.abdf

这是一个更好的例子,使用Joe Kington的解决方案和更逼真的df.我不确定的是如何访问下面每个df.a组的df.b元素:

a = np.random.random(20)
df = pandas.DataFrame({"a": a, "b": a + 10})
# bins for df.a
bins = np.linspace(0, 1, 10)
# bin df according to a
groups = df.groupby(np.digitize(df.a,bins))
# Get the mean of a in each group
print groups.mean()
## But …
Run Code Online (Sandbox Code Playgroud)

python numpy pandas

37
推荐指数
3
解决办法
6万
查看次数

标签 统计

numpy ×1

pandas ×1

python ×1