小编A.Z*_*A.Z的帖子

填充 groupby 对象的序列,Pandas

这是我的数据框示例,

d = {'id':['aa','aa','aa','aa','dd','dd','dd','ee','ee','ee','ee','ee'],
     'B': [3,2.9,4,2.3,3.1,2.2,2.9,4,2.3,3.3,2.9,3],
    'C':[1.9,2.2,2.9,0.2,1,2.1,1.3,3,3.1,2.2,2.9,0.2]}
df = pd.DataFrame(data=d)
df['tp'] = pd.to_timedelta(df.groupby('id').cumcount() * 30, unit='S')
df.set_index('tp', inplace=True)
Run Code Online (Sandbox Code Playgroud)

我正在尝试填充(后填充)上述数据框,以便每个唯一的 id 将具有相同的形状。

我就是这样开始的

g = df.groupby('id')
for id, id_unique in g:
    print(id_unique)
Run Code Online (Sandbox Code Playgroud)

我希望每个id_unique都具有相同的形状。即(4,3)。因此,所有唯一 ID 的计数都相同。

如果它是一个系列,我可以填充序列;

pad_sequences(data, padding='post', maxlen=max_seq)
Run Code Online (Sandbox Code Playgroud)

但是我不知道如何填充数据框。

喜欢...

           A    B    C  id  
tp                                                     
00:00:00  1.0  3.0  1.9  aa      
00:00:30  1.0  2.9  2.2  aa      
00:01:00  2.1  4.0  2.9  aa     
00:01:30  1.3  2.3  0.2  aa      
00:02:00  0.0  0.0  0.0  aa  

            A    B    C  id     
tp                                                     
00:00:00  1.1  3.1 …
Run Code Online (Sandbox Code Playgroud)

python padding pandas

2
推荐指数
1
解决办法
435
查看次数

标签 统计

padding ×1

pandas ×1

python ×1