相关疑难解决方法(0)

使用pandas GroupBy.agg()对同一列进行多次聚合

给出以下(完全矫枉过正的)数据框示例

import pandas as pd
import datetime as dt
df = pd.DataFrame({
         "date"    :  [dt.date(2012, x, 1) for x in range(1, 11)], 
         "returns" :  0.05 * np.random.randn(10), 
         "dummy"   :  np.repeat(1, 10)
})

Run Code Online (Sandbox Code Playgroud)

是否存在将两个不同的聚合函数应用于同一列的现有内置方法,而无需agg多次调用？

语法上错误但直观正确的方法是:

# Assume `function1` and `function2` are defined for aggregating.
df.groupby("dummy").agg({"returns":function1, "returns":function2})

Run Code Online (Sandbox Code Playgroud)

显然,Python不允许重复键.是否还有其他表达输入的方式agg？也许一个元组列表[(column, function)]会更好,允许多个函数应用于同一列？但它似乎只接受一本字典.

除了定义一个仅应用其中的两个函数的辅助函数之外,还有一个解决方法吗？(无论如何,它如何与聚合一起工作？)

python aggregate dataframe pandas pandas-groupby

ely*_*ely

2019 01-22

95
推荐指数

3
解决办法

5万
查看次数

命名返回Pandas聚合函数中的列？

我在使用Pandas的groupby功能时遇到了麻烦.我已经阅读了文档,但是我无法弄清楚如何将聚合函数应用于多个列并为这些列提供自定义名称.

这非常接近,但返回的数据结构具有嵌套的列标题:

data.groupby("Country").agg(
        {"column1": {"foo": sum()}, "column2": {"mean": np.mean, "std": np.std}})

Run Code Online (Sandbox Code Playgroud)

(即.我想取column2的mean和std,但将这些列作为"mean"和"std"返回)

我错过了什么？

python group-by aggregate-functions pandas

Dav*_*ard

lucky-day

69
推荐指数

4
解决办法

8万
查看次数

从groupby和多个聚合中展平分层索引的pandas.DataFrame

我正在按多列对数据帧进行分组并聚合以获取多个统计信息.如何获得一个完全平坦的结构,每个可能的组密钥组合枚举为行,每个统计数据作为列存在？

import numpy as np
import pandas as pd

cities = ['Berlin', 'Oslo']
days = ['Monday', 'Friday']

data = pd.DataFrame({
        'city': np.random.choice(cities, 12),
        'day': np.random.choice(days, 12),
        'people': np.random.normal(loc=10, size=12),
        'cats': np.random.normal(loc=6, size=12)})
grouped = data.groupby(['city', 'day']).agg([np.mean, np.std])

Run Code Online (Sandbox Code Playgroud)

这样我就得到了:

                   cats               people          
                   mean       std       mean       std
city   day                                            
Berlin Friday  6.146924  0.721263  10.445606  0.730992
       Monday  5.239267       NaN   9.022811       NaN
Oslo   Friday  6.322276  0.866899  11.579813  0.114341
       Monday  5.028919  0.815674  10.458439  1.182689

Run Code Online (Sandbox Code Playgroud)

我需要弄平:

city   day     cats_mean cats_std  people_mean people_std                                       
Berlin Friday  6.146924  0.721263  10.445606 …

Run Code Online (Sandbox Code Playgroud)

python indexing aggregate pandas

ada*_*.ra

lucky-day

3
推荐指数

1
解决办法

1325
查看次数

标签统计

pandas ×3

python ×3

aggregate ×2

aggregate-functions ×1

dataframe ×1

group-by ×1

indexing ×1

pandas-groupby ×1

使用pandas GroupBy.agg()对同一列进行多次聚合

命名返回Pandas聚合函数中的列？

从groupby和多个聚合中展平分层索引的pandas.DataFrame

标签 统计

标签统计