使用字典作为参数映射 Pandas 系列,其中值是元组

amo*_*972 5 python dictionary tuples pandas

我正在尝试用字典映射 df 的一列。我的字典包含元组作为值,我只想要元组的第一个元素。我怎样才能做到这一点?

my_dict = {'foo': (1, 0.1)}
df['original_column'] = 'foo'
Run Code Online (Sandbox Code Playgroud)

到目前为止我得到了什么:

df['mapped column'] = (1, 0.1)
Run Code Online (Sandbox Code Playgroud)

我想要的是:

df['mapped column'] = 1
Run Code Online (Sandbox Code Playgroud)

任何想法 ?

jez*_*ael 2

由字典理解创建的新字典使用Series.map来获取元组的第一个值:

df = pd.DataFrame({
'original_column':['foo','bar','baz']
})

my_dict = {'foo': (1, 0.1), 'bar':(2,0.5),'baz':(5,6)}
d = {k:v[0] for k, v in my_dict.items()}
df['mapped column'] = df['original_column'].map(d)
print (df)
  original_column  mapped column
0             foo              1
1             bar              2
2             baz              5
Run Code Online (Sandbox Code Playgroud)

另一个解决方案是映射原始值并通过 选择元组的第一个值str[0],但如果 DataFrame 较大,性能会更差:

my_dict = {'foo': (1, 0.1), 'bar':(2,0.5),'baz':(5,6)}
df['mapped column'] = df['original_column'].map(my_dict).str[0]
print (df)
  original_column  mapped column
0             foo              1
1             bar              2
2             baz              5
Run Code Online (Sandbox Code Playgroud)