在列表中的元素上“合并”两个数据框?

use*_*654 2 python merge list pandas

我想进行以下合并(很难用文字描述):这是我的数据框

df8=pd.DataFrame({'names':[['Hans','Meier'],['Debby','Harry','Peter']]})
    names
 0 ['Hans','Meier']
 1 ['Debby','Harry','Peter']

df9=pd.DataFrame({'caller':['Hans','Meier','Debby','Harry','Peter'],'text':[['hi im hans'],['hi im meier'],['hi im debby'],['hi im harry'],['hi im peter']]})
df9.set_index(df9.caller, inplace = True)
df9.drop('caller', axis = 1, inplace = True)

 caller     text
 Hans        ['hi im hans']
 Meier       ['hi im meier']
 .
 .
 .
Run Code Online (Sandbox Code Playgroud)

结果应如下所示

      names                  content
0 ['Hans','Meier']          ['hi im hans', 'hi im meier']
1 ['Debby','Harry','Peter'] ['hi im debby', 'hi im harry', 'hi im peter']
Run Code Online (Sandbox Code Playgroud)

因此,如果人员是相应名称列表的元素,则df9中人员说的文本将出现在df8中。

我认为这是一个类似的问题, 可是我没有看到一个解决方案有

我查看了有关串联,联接和合并的pandas文档,但没有找到解决方案

WeN*_*Ben 6

这是一种方法

df9['text']=df9['text'].str[0]

l=[df9.loc[x,'text'].tolist() for x in df8.names]
Out[505]: [['hi im hans', 'hi im meier'], ['hi im debby', 'hi im harry', 'hi im peter']]

df9['cont']=l
Run Code Online (Sandbox Code Playgroud)


Ian*_*anS 5

您可以在中查询值df9

df8['contents'] = df8['names'].apply(lambda l: [df9['text'].loc[name] for name in l])
Run Code Online (Sandbox Code Playgroud)


ank*_*_91 5

使用s.get

d=df9.set_index('caller')['text']
df8=df8.assign(content=df8.names.apply(lambda x:[d.get(i) for i in x]))
print(df8)
Run Code Online (Sandbox Code Playgroud)
                   names                                        content
0          [Hans, Meier]                  [[hi im hans], [hi im meier]]
1  [Debby, Harry, Peter]  [[hi im debby], [hi im harry], [hi im peter]]
Run Code Online (Sandbox Code Playgroud)