有没有办法_merge在合并后获得等效的指标变量dplyr?
类似于Pandas indicator = True选项的东西基本上告诉你合并是如何进行的(来自每个数据集的匹配数等).
这是一个例子 Pandas
import pandas as pd
df1 = pd.DataFrame({'key1' : ['a','b','c'], 'v1' : [1,2,3]})
df2 = pd.DataFrame({'key1' : ['a','b','d'], 'v2' : [4,5,6]})
match = df1.merge(df2, how = 'left', indicator = True)
Run Code Online (Sandbox Code Playgroud)
在这里,经过left join之间df1和df2,你想立刻知道多少行df1找到了匹配中df2,有多少人没
match
Out[53]:
key1 v1 v2 _merge
0 a 1 4.0 both
1 b 2 5.0 both
2 c 3 NaN left_only
Run Code Online (Sandbox Code Playgroud)
我可以将这个merge变量制成表格:
match._merge.value_counts()
Out[52]: …Run Code Online (Sandbox Code Playgroud)