相关疑难解决方法(0)

熊猫数据帧中的内部连接/合并比左数据帧提供更多的行

以下是数据框列的外观。

df1='device number', 'date', ....<<10 个其他列>> 3500 条记录

df2='device number', 'date', ....<<9 个其他列>> 14,000 条记录

在每个数据帧中,“设备编号”和“日期”都不是唯一的。但是,它们的组合对于标识行是唯一的。

我试图形成一个新的数据框,它匹配来自 df1 和 df2 的行,其中设备号和日期都相等,并且具有这些 df1 和 df2 中的所有列。我正在尝试的熊猫命令是

df3=pd.merge(df1, df2, how='inner', on=['device number', 'date'])
Run Code Online (Sandbox Code Playgroud)

但是,df3 给了我一个形状为 (14,000, 21) 的数据框。列号是有道理的,但是内连接的行如何比任何左侧数据帧都多?这是否意味着我对内连接的理解有缺陷?另外,我怎样才能达到我描述的结果?

python join inner-join dataframe pandas

6
推荐指数
1
解决办法
5323
查看次数

熊猫离开加入 - 为什么更多的结果?

大熊猫怎么可能离开加入像

df.merge(df2, left_on='first', right_on='second', how='left')
Run Code Online (Sandbox Code Playgroud)

将数据框从 221309 增加到 1388680 行?

编辑

df 1 的形状 (221309, 83)

df2 的形状 (7602, 6)

python join left-join dataframe pandas

3
推荐指数
1
解决办法
2406
查看次数

标签 统计

dataframe ×2

join ×2

pandas ×2

python ×2

inner-join ×1

left-join ×1