我有两个数据框,DF1 和 DF2。DF1 为主,DF2 为增量。来自DF2 的数据应插入DF1 或用于更新DF1 数据。
假设 DF1 具有以下格式:
| 证件号码 | 开始日期 | 数量 | 天 |
|---|---|---|---|
| 1 | 2016-01-01 | 4650 | 22 |
| 2 | 2016-01-02 | 3130 | 45 |
| 1 | 2016-01-03 | 4456 | 22 |
| 2 | 2016-01-15 | 1234 | 45 |
DF2 包含以下内容:
| 证件号码 | 开始日期 | 数量 | 天 |
|---|---|---|---|
| 1 | 2016-01-01 | 8650 | 52 |
| 2 | 2016-01-02 | 7130 | 65 |
| 1 | 2016-01-06 | 3456 | 20 |
| 2 | 2016-01-20 | 2345 | 19 |
| 3 | 2016-02-02 | 1345 | 19 |
我需要组合两个数据帧,如果 DF2 的“id_no”和“开始日期”与 DF1 匹配,则应在 DF1 中替换它,如果不匹配,则应将其插入到 DF1 中。“id_no”不是唯一的。
预期结果:
| 证件号码 | 开始日期 | 数量 | 天 |
|---|---|---|---|
| 1 | 2016-01-01 | 8650 | 52 |
| 2 | 2016-01-02 | 7130 | 65 |
| 1 … |
如果有一个数字流,您如何跟踪第1,000,000个最大的数字?
我在接受采访时被问到这个问题.