在python中使用Pandas合并后如何找到丢失的数据?

Dat*_*wer 4 python pandas

我的数据框如下所示。我正在使用 Pandas 合并功能来合并两个数据框,并且我正在尝试查找被删除的行。Pandas 或 python 有没有办法跟踪这个?

df1=pd.DataFrame(({'Name':('A','B','C'),'Age':(34,23,90)}))
df2=pd.DataFrame(({'Name':('A','B','D'),'Add':('rt','ct','pt')}))
pd.merge(df1,df2,on='Name')
Run Code Online (Sandbox Code Playgroud)

jez*_*ael 6

使用merge带外连接和参数indicator=True

df = pd.merge(df1,df2,on='Name', indicator=True, how='outer')
print (df)
  Name   Age  Add      _merge
0    A  34.0   rt        both
1    B  23.0   ct        both
2    C  90.0  NaN   left_only
3    D   NaN   pt  right_only
Run Code Online (Sandbox Code Playgroud)

最后过滤没有两行boolean indexing

print (df[df['_merge'] != 'both'])
  Name   Age  Add      _merge
2    C  90.0  NaN   left_only
3    D   NaN   pt  right_only
Run Code Online (Sandbox Code Playgroud)

另一种解决方案是过滤isin和反转掩码~

print (df1[~df1['Name'].isin(df2['Name'])])
  Name  Age
2    C   90

print (df2[~df2['Name'].isin(df1['Name'])])
  Name Add
2    D  pt
Run Code Online (Sandbox Code Playgroud)