如何在pandas中的特定列索引处插入列?

Hap*_*yPy 153 python indexing pandas

我可以在pandas中的特定列索引处插入列吗?

import pandas as pd
df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]})
df['n'] = 0
Run Code Online (Sandbox Code Playgroud)

这将把列n作为最后一列df,但是有没有办法告诉df我们n在开头?

Jef*_*eff 301

看文档: http //pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.insert.html

使用loc = 0将在开头插入

df.insert(loc, column, value)
Run Code Online (Sandbox Code Playgroud)
df = pd.DataFrame({'B': [1, 2, 3], 'C': [4, 5, 6]})

df
Out: 
   B  C
0  1  4
1  2  5
2  3  6

idx = 0
new_col = [7, 8, 9]  # can be a list, a Series, an array or a scalar   
df.insert(loc=idx, column='A', value=new_col)

df
Out: 
   A  B  C
0  7  1  4
1  8  2  5
2  9  3  6
Run Code Online (Sandbox Code Playgroud)

  • 对于将来的用户,新参数是*"loc","column",*和*"value"*.[来源](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.insert.html) (16认同)
  • 对于未来的用户,如果您想借助特定列名而不是索引进行插入,请使用:`df.insert(df.columns.get_loc('col_name'), 'new_col_name', ser_to_insert)`。`insert` 不直接支持列名用例,但您可以从列名获取列索引并传递它。 (4认同)

Hug*_*res 38

如果您想要所有行的单个值:

df.insert(0,'name_of_column','')
df['name_of_column'] = value
Run Code Online (Sandbox Code Playgroud)

编辑:

你也可以:

df.insert(0,'name_of_column',value)
Run Code Online (Sandbox Code Playgroud)


mhc*_*YAN 19

df.insert(loc, column_name, value)
Run Code Online (Sandbox Code Playgroud)

如果没有其他同名列,这将起作用。如果数据框中已存在具有您提供的名称的列,则会引发 ValueError。

allow_duplicates您可以传递带有值的可选参数,True以使用现有列名称创建新列。

这是一个例子:



    >>> df = pd.DataFrame({'b': [1, 2], 'c': [3,4]})
    >>> df
       b  c
    0  1  3
    1  2  4
    >>> df.insert(0, 'a', -1)
    >>> df
       a  b  c
    0 -1  1  3
    1 -1  2  4
    >>> df.insert(0, 'a', -2)
    Traceback (most recent call last):
      File "", line 1, in 
      File "C:\Python39\lib\site-packages\pandas\core\frame.py", line 3760, in insert
        self._mgr.insert(loc, column, value, allow_duplicates=allow_duplicates)
      File "C:\Python39\lib\site-packages\pandas\core\internals\managers.py", line 1191, in insert
        raise ValueError(f"cannot insert {item}, already exists")
    ValueError: cannot insert a, already exists
    >>> df.insert(0, 'a', -2,  allow_duplicates = True)
    >>> df
       a  a  b  c
    0 -2 -1  1  3
    1 -2 -1  2  4


Nic*_*Nic 11

您可以尝试将列提取为列表,根据需要按下,并重新索引数据框:

>>> cols = df.columns.tolist()
>>> cols = [cols[-1]]+cols[:-1] # or whatever change you need
>>> df.reindex(columns=cols)

   n  l  v
0  0  a  1
1  0  b  2
2  0  c  1
3  0  d  2
Run Code Online (Sandbox Code Playgroud)

编辑:这可以在一行中完成; 然而,这看起来有点难看.也许一些更清洁的提案可能来......

>>> df.reindex(columns=['n']+df.columns[:-1].tolist())

   n  l  v
0  0  a  1
1  0  b  2
2  0  c  1
3  0  d  2
Run Code Online (Sandbox Code Playgroud)