如何替换熊猫中的部分数据框

Question

如何替换熊猫中的部分数据框

我有这样的示例数据框

df1=

A B C
a 1 2
b 3 4
b 5 6 
c 7 8
d 9 10

Run Code Online (Sandbox Code Playgroud)

我想用这个数据帧替换这个数据帧的一部分（col A=a 和 b）

df2=

A B C
b 9 10
b 11 12
c 13 14

Run Code Online (Sandbox Code Playgroud)

我想在下面得到结果

df3=

A B C
a 1 2
b 9 10
b 11 12
c 13 14
d 9 10

Run Code Online (Sandbox Code Playgroud)

我试过

df1[df1.A.isin("bc")]...

Run Code Online (Sandbox Code Playgroud)

但我不知道如何更换。有人告诉如何替换数据框。

Answer 1

WeN*_*Ben 5

正如我所解释的那样 try update。

import pandas as pd


 df1 = pd.DataFrame({"A":['a','b','b','c'], "B":[1,2,4,6], "C":[3,2,1,0]})

 df2 = pd.DataFrame({"A":['b','b','c'], "B":[100,400,300], "C":[39,29,100]}).set_index(df1.loc[df1.A.isin(df2.A),:].index)

 df1.update(df2)

Out[75]: 
   A      B      C
0  a    1.0    3.0
1  b  100.0   39.0
2  b  400.0   29.0
3  c  300.0  100.0

Run Code Online (Sandbox Code Playgroud)

Answer 2

jez*_*ael 2

您需要combine_first或update按列A，但因为重复需要cumcount：

df1['g'] = df1.groupby('A').cumcount()
df2['g'] = df2.groupby('A').cumcount()
df1 = df1.set_index(['A','g'])
df2 = df2.set_index(['A','g'])

df3 = df2.combine_first(df1).reset_index(level=1, drop=True).astype(int).reset_index()
print (df3)
   A   B   C
0  a   1   2
1  b   9  10
2  b  11  12
3  c  13  14
4  d   9  10

Run Code Online (Sandbox Code Playgroud)

另一个解决方案：

df1['g'] = df1.groupby('A').cumcount()
df2['g'] = df2.groupby('A').cumcount()
df1 = df1.set_index(['A','g'])
df2 = df2.set_index(['A','g'])

df1.update(df2)
df1 = df1.reset_index(level=1, drop=True).astype(int).reset_index()
print (df1)
   A   B   C
0  a   1   2
1  b   9  10
2  b  11  12
3  c  13  14
4  d   9  10

Run Code Online (Sandbox Code Playgroud)

A如果列中的重复项df1相同df2且长度相同：

df2.index = df1.index[df1.A.isin(df2.A)]
df3 = df2.combine_first(df1)
print (df3)
   A     B     C
0  a   1.0   2.0
1  b   9.0  10.0
2  b  11.0  12.0
3  c  13.0  14.0
4  d   9.0  10.0

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，7 月前
查看次数：	5754 次
最近记录：	8 年，7 月前