根据多个条件向 Python Pandas DataFrame 添加新列

Abd*_*man 12 python numpy pandas

我有一个包含各种列的数据集,如下所示:

discount tax total subtotal productid 3.98 1.06 21.06 20 3232 3.98 1.06 21.06 20 3232 3.98 6 106 100 3498 3.98 6 106 100 3743 3.98 6 106 100 3350 3.98 6 106 100 3370 46.49 3.36 66.84 63 695

现在,我需要添加一个新列Class并根据以下条件为其分配0或值1

if:
    discount > 20%
    no tax
    total > 100
then the Class will 1
otherwise it should be 0
Run Code Online (Sandbox Code Playgroud)

我在一个条件下完成了它,但我不知道如何在多个条件下完成它。

这是我尝试过的:

df_full['Class'] = df_full['amount'].map(lambda x: 1 if x > 100 else 0)
Run Code Online (Sandbox Code Playgroud)

我查看了所有其他类似的问题,但找不到任何解决我的问题的方法。

TypeError: '>' not supported between instances of 'str' and 'int'

这是第一次发布答案的情况,我已经尝试过:

df_full['class'] = np.where( ( (df_full['discount'] > 20) & (df_full['tax'] == 0 ) & (df_full['total'] > 100) & df_full['productdiscount'] ) , 1, 0)
Run Code Online (Sandbox Code Playgroud)

Gus*_*rra 24

您可以使用 跨数据帧行应用任意函数DataFrame.apply

在您的情况下,您可以定义一个函数,如:

def conditions(s):
    if (s['discount'] > 20) or (s['tax'] == 0) or (s['total'] > 100):
        return 1
    else:
        return 0
Run Code Online (Sandbox Code Playgroud)

并使用它为您的数据添加一个新列:

df_full['Class'] = df_full.apply(conditions, axis=1)
Run Code Online (Sandbox Code Playgroud)


Kar*_*nka 5

从你的数据图像来看,你说的discount20%是什么意思是相当不清楚的。

但是,您可能会执行此类操作。

df['class'] = 0 # add a class column with 0 as default value

# find all rows that fulfills your conditions and set class to 1
df.loc[(df['discount'] / df['total'] > .2) & # if discount is more than .2 of total 
       (df['tax'] == 0) & # if tax is 0
       (df['total'] > 100), # if total is > 100 
       'class'] = 1 # then set class to 1
Run Code Online (Sandbox Code Playgroud)

请注意,这&意味着and在这里,如果您想or改用|.