相关疑难解决方法(0)

Pandas:为groupby标识的每个组分配一个索引

使用groupby()时,如何使用包含组编号索引的新列创建DataFrame,类似于dplyr::group_indicesR中.例如,如果我有

>>> df=pd.DataFrame({'a':[1,1,1,2,2,2],'b':[1,1,2,1,1,2]})
>>> df
   a  b
0  1  1
1  1  1
2  1  2
3  2  1
4  2  1
5  2  2

Run Code Online (Sandbox Code Playgroud)

我怎么能得到一个像DataFrame

Run Code Online (Sandbox Code Playgroud)

(idx索引的顺序无关紧要)

python pandas

use*_*066

2018 07-16

15
推荐指数

3
解决办法

9530
查看次数

Python Pandas:我如何分组并为组中的所有项目分配ID？

我有df:

domain           orgid
csyunshu.com    108299
dshu.com        108299
bbbdshu.com     108299
cwakwakmrg.com  121303
ckonkatsunet.com    121303

Run Code Online (Sandbox Code Playgroud)

我想添加一个新列,用每个orgid替换域列和数字ID:

domain           orgid   domainid
csyunshu.com    108299      1
dshu.com        108299      2
bbbdshu.com     108299      3
cwakwakmrg.com  121303      1
ckonkatsunet.com 121303     2

Run Code Online (Sandbox Code Playgroud)

我已经尝试过这一行,但它没有给出我想要的结果:

df.groupby('orgid').count['domain'].reset_index()

Run Code Online (Sandbox Code Playgroud)

有人可以帮忙吗？

python indexing group-by pandas

Use*_*YmY

lucky-day

5
推荐指数

1
解决办法

5570
查看次数

标签统计

pandas ×2

python ×2

group-by ×1

indexing ×1

Pandas:为groupby标识的每个组分配一个索引

Python Pandas:我如何分组并为组中的所有项目分配ID？

标签 统计

标签统计