Pandas 数据框到元组列表的字典

Bru*_*llo 4 python dataframe pandas pandas-groupby

假设我有以下数据框:

df = pd.DataFrame({'id': [1,2,3,3,3], 'v1': ['a', 'a', 'c', 'c', 'd'], 'v2': ['z', 'y', 'w', 'y', 'z']})
df
id  v1  v2
1   a   z
2   a   y
3   c   w
3   c   y
3   d   z
Run Code Online (Sandbox Code Playgroud)

我想将其转换为这种格式:

{1: [('a', 'z')], 2: [('a', 'y')], 3: [('c', 'w'), ('c', 'y'), ('d', 'z')]}
Run Code Online (Sandbox Code Playgroud)

我基本上想创建一个字典,其中键是 id,值是这个 id 的 (v1,v2) 的元组列表。

我尝试在 id 中使用 groupby:

df.groupby('id')[['v1', 'v2']].apply(list)
Run Code Online (Sandbox Code Playgroud)

但这没有用

jez*_*ael 6

首先创建元组,然后groupby使用聚合传递给list

d = df[['v1', 'v2']].agg(tuple, 1).groupby(df['id']).apply(list).to_dict()
print (d)
{1: [('a', 'z')], 2: [('a', 'y')], 3: [('c', 'w'), ('c', 'y'), ('d', 'z')]}
Run Code Online (Sandbox Code Playgroud)

另一个想法是使用MultiIndex

d = df.set_index(['v1', 'v2']).groupby('id').apply(lambda x: x.index.tolist()).to_dict()
Run Code Online (Sandbox Code Playgroud)