熊猫合并101

Question

熊猫合并101

cs9*_*s95 271 python merge join pandas

如何用pandas 执行(LEFT| RIGHT| FULL)(INNER| OUTER)连接？
合并后如何为缺失的行添加NaN？
合并后如何摆脱NaN？
我可以合并索引吗？
如何合并多个DataFrame？
merge？join？concat？update？谁？什么？为什么？!

... 和更多.我已经看到了这些反复出现的问题,询问了pandas合并功能的各个方面.今天关于合并及其各种用例的大部分信息在几十个措辞严厉,不可搜索的帖子中都是分散的.这里的目的是为后代整理一些更重要的观点.

这个QnA应该是关于常见熊猫习语的一系列有用的用户指南的下一部分(参见关于转动的这篇文章,以及关于连接的这篇文章,我将在稍后介绍).

请注意,这篇文章并不是文档的替代品,所以请阅读它!一些例子来自那里.

Answer 1

cs9*_*s95 375

这篇文章旨在为读者提供关于SQL风格的大熊猫合并,如何使用以及何时不使用它的入门知识.

特别是,这篇文章将通过以下内容:

基础知识 - 连接类型(LEFT,RIGHT,OUTER,INNER)
- 合并不同的列名称
- 避免输出中出现重复的合并键列
在不同条件下与指数合并
- 有效地使用你的命名索引
- 合并键作为另一个的列和列的索引
Multiway合并列和索引(唯一和非唯一)
着名的替代品merge和join

这篇文章不会经历的内容:

与绩效相关的讨论和时间安排(目前).在合适的情况下,最值得注意的是提到更好的替代品.
处理后缀,删除额外的列,重命名输出和其他特定用例.还有其他(阅读:更好)帖子处理,所以搞清楚!

注意
除非另有说明,否则大多数示例默认为INNER JOIN操作,同时演示各种功能.

此外,可以复制和复制此处的所有DataFrame,以便您可以使用它们.另外,请参阅此文章 ,了解如何从剪贴板中读取DataFrame.

最后,通过文章https://www.codeproject.com/Articles/33052/Visual-Representation-of-SQL-Joins借鉴了JOIN操作的所有可视化表示 .

足够的谈话,只是告诉我如何使用`merge`!

建立

np.random.seed(0)
left = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': np.random.randn(4)})    
right = pd.DataFrame({'key': ['B', 'D', 'E', 'F'], 'value': np.random.randn(4)})

left

  key     value
0   A  1.764052
1   B  0.400157
2   C  0.978738
3   D  2.240893

right

  key     value
0   B  1.867558
1   D -0.977278
2   E  0.950088
3   F -0.151357

归档时间：	6 年，9 月前
查看次数：	40946 次
最近记录：	5 年，9 月前

熊猫合并101

足够的谈话,只是告诉我如何使用merge!

Other JOINs - LEFT-Excluding, RIGHT-Excluding, and FULL-Excluding/ANTI JOINs

Different names for key columns

Avoiding duplicate key column in output

Merging only a single column from one of the merge

Merging on multiple columns

Other useful merge operations and functions

Index-based*-JOIN (+ index-column lefts)

Support for index names

Merging on index of one, column(s) of another

Generalizing: join='inner'ing multiple DataFrames

Multiway合并唯一索引

Multiway合并索引与重复

加入101

内部联接

外连接或全连接

右连接

左连接

泛化到多个 DataFrame

唯一键上的多路合并

对具有重复项的键进行多路合并

继续阅读

基于索引的连接

TL; 博士

索引到索引连接

索引到列连接

有效地使用命名索引 [pandas >= 0.23]

继续阅读

足够的谈话,只是告诉我如何使用`merge`!

Merging only a single column from one of the `merge`

Other useful `merge` operations and functions

Index-based*-JOIN (+ index-column `left`s)

Generalizing: `join='inner'`ing multiple DataFrames