小编wei*_*god的帖子

Pandas DataFrame 找到 Groupby 两列后的最大值并获取计数

我有一个数据框 df 如下:

   userId  pageId  tag
0  3122471  e852   18
1  3122471  f3e2   18
2  3122471  7e93   18
3  3122471  2768    6
4  3122471  53d9    6
5  3122471  06d7   15
6  3122471  e31c   15
7  3122471  c6f3    2
8  1234123  fjwe    1
9  1234123  eiae    4
10 1234123  ieha    4
Run Code Online (Sandbox Code Playgroud)

使用后df.groupby(['userId', 'tag'])['pageId'].count()按 userId 和 tag 对数据进行分组。我会得到:

userId   tag
3122471  2      1
         6      2
         15     2
         18     3
1234123   1     1
          4     2
Run Code Online (Sandbox Code Playgroud)

现在我想找到每个用户拥有最多的标签。如下:

userId   tag
3122471  18
1234123 …
Run Code Online (Sandbox Code Playgroud)

python data-analysis dataframe python-3.x pandas

6
推荐指数
1
解决办法
1万
查看次数

标签 统计

data-analysis ×1

dataframe ×1

pandas ×1

python ×1

python-3.x ×1