相当于SQL non-equi JOIN的Pandas

fir*_*eak 5 python merge join dataframe pandas

因此,我有两个要合并在一起的数据框。

我正在合并3列,其中2个是简单的联接。

joined_df = pd.merge(df1, df2, how='left', on=['name', 'city'])
Run Code Online (Sandbox Code Playgroud)

我希望这是使用第三列,但这将是一个比较,如下所示:

joined_df = pd.merge(df1, df2, how='left',
on=['name', 'city', 'df1.year' >= 'df2.year_min'])
Run Code Online (Sandbox Code Playgroud)

不知道正确的语法在这里。

如果是SQL,对我来说将很容易。

SELECT * FROM df1
JOIN df2 on (df1.name = df2.name and df1.year = df2.year and df1.year > df2.year_min)
Run Code Online (Sandbox Code Playgroud)

有什么帮助吗?

cs9*_*s95 5

Pandasmerge只支持 equi-joins。您需要添加过滤结果的第二步,如下所示:

joined_df = df1.merge(df2, how='left', on=['name', 'city'])
joined_df = joined_df[joined_df.year > joined_df.year_min]
Run Code Online (Sandbox Code Playgroud)

  • @firestreak,如果你想在一行中完成,你可以链接 [`query`](http://pandas.pydata.org/pandas-docs/version/0.21/generated/pandas.DataFrame.query.html)像这样:`df1.merge(df2, on=['name', 'city']).query('year > year_min')`。此外,`how=left` 会做一个 `left join`,而不是你在 sql 片段中显示的 `inner join` (2认同)