小编Shi*_*ar 的帖子

Groupby on pandas dataframe,并根据列中值的频率用逗号连接字符串

这是对我的DataFrame结构的更新,我在仓促中制定了结构,我正在检查单个用户并模拟该结构.@liliscent的评论:"数据意外地满足这个条件"也是如此,value_counts和cum_sum()解决了它.但是,user_id也会发生变化,如果具有相同的文本,则不同的用户可以拥有相同的meet_id.

更新了DataFrames结构:

   mytable = pd.DataFrame({'user_id': [ '3c', '3c', '3c', '3c','3c', '3c', '3c', '3c', '3c', '3c', '3c', '3c', '3c', '3d',
                                 '3d', '3d', '3d', '3e', '3e', '3r', '3w', '3w', '3w', '3w'],
              'meet_id': [1,1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,4,5,6,1,2,1,1], 'text': ['abc', 'abc', 'abc', 'abc', 'abc', 'abc', 'abc',
        'xyz', 'xyz', 'xyz', 'xyz', 'xyz', 'xyz', 'npq', 'npq', 'npq', 'npq', 'tt', 'op', 'li', 'abc', 'xyz', 'abc', 'abc'], 'label': ['A', 'A', 'A', 'A', 'A','B', 'B', 'B', 'B', 'B',
    'C', 'C', 'A', 'G', 'H', 'H', 'H', 'A', 'A', 'B', 'E', 'G', 'B', 'B']}) …

Run Code Online (Sandbox Code Playgroud)

python dataframe pandas pandas-groupby

Shi*_*ar

2018 05-10

10
推荐指数

2
解决办法

951
查看次数