如果熊猫满足条件,则更新列

Dan*_*niB 3 python dataframe pandas

我有一个数据框要处理,我正在执行多项检查。

我正在检查“A”、“B”和“C”列下的重复值是否显示相同的数字,但在 D 列下具有相反的符号。

一种 C D
1111 AAA 123 0.01 评论被替换
2222 BBB 456 5 评论被替换
3333 CCC 789 10 什么都不做
1111 AAA 123 -0.01 评论被替换
2222 BBB 456 -5 评论被替换
3333 CCC 789 -9 什么都不做

请在下面查看我的代码。当我尝试替换“E”列下的注释时,它不起作用。我确定我做错了什么。我完全意识到我没有以最有效的方式编写代码,我仍然是一个新手。您能否以更有效的方式帮助我实现这一目标,并且出于好奇,如果我决定继续使用这种“非高效”方式,如何实现这一目标?

谢谢你。

for i in range(0, len(df)-1):
    for j in range(i+1, len(df)):
        if (df['A'][i] == df['A'][j]) & (df['B'][i] == df['B'][j]) & (df['C'][i] == df['C'][j]) & (df['D'][i] + df['D'][j] = 0) :
            df['E'][i] = 'it works!'
Run Code Online (Sandbox Code Playgroud)

Shu*_*rma 6

我们可以group在列数据框ABC在专栏系列绝对值沿DtransformD使用sum因为如果对有符号相反则有和必须为零),以检查其幅度相同,但符号相反对的存在

df['E'] = df.groupby(['A', 'B', 'C', df['D'].abs()])['D'].transform('sum').eq(0) 
Run Code Online (Sandbox Code Playgroud)
      A    B    C      D      E
0  1111  AAA  123   0.01   True
1  2222  BBB  456   5.00   True
2  3333  CCC  789  10.00  False
3  1111  AAA  123  -0.01   True
4  2222  BBB  456  -5.00   True
5  3333  CCC  789  -9.00  False
Run Code Online (Sandbox Code Playgroud)