通过添加其他列的值,在Panda数据框中创建新列

n00*_*00b 42 python python-2.7 pandas

我有一个数据框,其值如

A B
1 4
2 6
3 9
Run Code Online (Sandbox Code Playgroud)

我需要通过添加A列和B列的值来添加新列,例如

A B C
1 4 5
2 6 8
3 9 12
Run Code Online (Sandbox Code Playgroud)

我相信这可以使用lambda函数完成,但我无法弄清楚如何做到这一点.

Dee*_*ace 64

非常简单:

df['C'] = df['A'] + df['B']
Run Code Online (Sandbox Code Playgroud)

  • 我收到以下警告:尝试在DataFrame的切片副本上设置值.尝试使用.loc [row_indexer,col_indexer] = value (28认同)

小智 38

最简单的方法是使用DeepSpace答案.但是,如果您真的想使用匿名函数,可以使用apply:

df['C'] = df.apply(lambda row: row['A'] + row['B'], axis=1)
Run Code Online (Sandbox Code Playgroud)


Ant*_*pov 24

您可以使用sum函数来实现,如注释中提到的@EdChum:

df['C'] =  df[['A', 'B']].sum(axis=1)

In [245]: df
Out[245]: 
   A  B   C
0  1  4   5
1  2  6   8
2  3  9  12
Run Code Online (Sandbox Code Playgroud)


spa*_*row 20

在Anton的答案上建立更多内容,您可以添加如下所有列:

df['sum'] = df[list(df.columns)].sum(axis=1)
Run Code Online (Sandbox Code Playgroud)

  • 您可以删除`list(df.columns)`,因为这里多余。因此,最终代码应类似于`df ['sum'] = df.sum(axis = 1)` (3认同)
  • 我不敢相信这个答案没有多少赞成票。这是唯一一种无需单独键入列名即可获得总和的方法!谢谢@麻雀! (2认同)

ste*_*veb 7

从Pandas版本0.16.0开始,您可以使用assign如下:

df = pd.DataFrame({"A": [1,2,3], "B": [4,6,9]})
df.assign(C = df.A + df.B)

# Out[383]: 
#    A  B   C
# 0  1  4   5
# 1  2  6   8
# 2  3  9  12
Run Code Online (Sandbox Code Playgroud)

您可以通过以下方式添加多个列:

df.assign(C = df.A + df.B,
          Diff = df.B - df.A,
          Mult = df.A * df.B)
# Out[379]: 
#    A  B   C  Diff  Mult
# 0  1  4   5     3     4
# 1  2  6   8     4    12
# 2  3  9  12     6    27
Run Code Online (Sandbox Code Playgroud)

  • 此方法避免了@n00b 提到的警告。 (2认同)

Man*_*nez 6

您可以这样做:

df['C'] = df.sum(axis=1)
Run Code Online (Sandbox Code Playgroud)

如果只想做数值:

df['C'] = df.sum(axis=1, numeric_only=True)
Run Code Online (Sandbox Code Playgroud)