pd.merge() 和 dataframe.merge() 之间的区别

Emi*_* Lo 6 python merge pandas

pd.merge我想知道当您合并时与合并时有什么区别dataframe.merge(),示例如下:

pd.merge(dataframe1, dataframe2)
Run Code Online (Sandbox Code Playgroud)

dataframe1.merge(dataframe2)
Run Code Online (Sandbox Code Playgroud)

Dr *_*ora 9

我们有两个函数可以用来完成几乎相同的任务:pandas.merge() 和 DataFrame.merge()。

pandas.merge(left, right, how='inner', on=None, left_on=None, right_on=None, 
          left_index=False, right_index=False, 
          sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)

DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, 
             left_index=False, right_index=False, 
             sort=False, suffixes='_x', '_y', copy=True, indicator=False, validate=None)
Run Code Online (Sandbox Code Playgroud)

两者看起来很相似,使用其中一种比另一种有什么优势?

pd.merge() 调用 df.merge,因此 df1.merge(df2) 将给出与 pd.merge(df1, df2) 几乎相同的结果。

然而, pd.merge() 是包装 style函数,而 df1.merge() 是链接 style,这使得后者更容易从左到右链接

例如,

 df1.merge(df2).merge(df3) 
 #looks better and readable [analogus to %>% pipeline operator in R] than 
 pd.merge(pd.merge(df1, df2), df3).
Run Code Online (Sandbox Code Playgroud)

让我们看一个可重现的例子

d1 = pd.read_html('https://worldpopulationreview.com/countries')
pop = d1[0]
print(pop.info(), '\n') #Data for 232 countries for 7 columns

pop.head(3)

d2 = pd.read_html('https://worldpopulationreview.com/country-rankings/median-age')
age = d2[0]
print(age.info(), '\n') #Data for 221 countries for 5 columns

age.head(3)

display('pd.merge(): ', pd.merge(pop, age), 'df.merge(): ', pop.merge(age))
Run Code Online (Sandbox Code Playgroud)