Arv*_*mar 1 python multiple-columns dataframe pandas
我在pandas数据框下面df.我试图重命名列名称,但它没有按预期工作.
码:
mapping = {df.columns[0]:'Date', df.columns[1]: 'A', df.columns[2]:'B', df.columns[3]: 'C',df.columns[4]:'D', df.columns[5]: 'E',df.columns[6]:'F', df.columns[7]: 'G',df.columns[8]:'H', df.columns[9]: 'J'}
df.rename(columns=mapping)
Run Code Online (Sandbox Code Playgroud)
产量df.columns:
MultiIndex(levels=[['A Index', 'B Index', 'C Index', 'D Index', 'E Index', 'F Index', 'G Index', 'H Index', 'I Index', 'J Index', 'K Index', 'L Index', 'M Index', 'N Index', 'O Index', 'date', 'index'], ['PX_LAST', '']],
labels=[[16, 15, 11, 9, 10, 6, 3, 4, 2, 5, 14, 1, 13, 12, 7, 0, 8], [1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]],
names=['ticker', 'field'])
Run Code Online (Sandbox Code Playgroud)
即使在运行代码之后,列名也保持不变.任何人都可以帮助重命名此数据帧的列名称.
假设您有一个映射,例如:
mapping = {"old_name_1" : "new_name_1", "old_name_2" : "new_name_2"}
Run Code Online (Sandbox Code Playgroud)
根据 pandas 的先前文档,axis 参数的默认值为 0(表示索引)。
因此,将命令更改为:
df = df.rename(columns = mapping, axis = 1)
Run Code Online (Sandbox Code Playgroud)
,其中 axis 等于 1 表示列,将按预期工作。
另外,您可以使用 inplace 参数,这样您就不必重新设置 DataFrame。
df.rename(columns = mapping, axis = 1, inplace = True)
Run Code Online (Sandbox Code Playgroud)
(感谢@Gordon 的提醒)
你可以只使用:
df = df.rename(columns = mapping)
Run Code Online (Sandbox Code Playgroud)
或者
df.rename(columns = mapping, inplace = True)
Run Code Online (Sandbox Code Playgroud)
通过新的更新(请参阅文档),pandas 明白,当您设置映射到列参数时,您意味着更改列的值(因为这是合乎逻辑的);因此,轴参数是不必要的。
因为您知道列的顺序,所以为什么不使用:
df.columns = ['Date', 'a', 'b', 'c', 'd', 'e', 'f' 'g', 'h', 'i', 'j']
Run Code Online (Sandbox Code Playgroud)
否则,如果要使用rename,则需要将其分配给变量:
mapping = {df.columns[0]:'Date', df.columns[1]: 'A', df.columns[2]:'B', df.columns[3]: 'C',df.columns[4]:'D', df.columns[5]: 'E',df.columns[6]:'F', df.columns[7]: 'G',df.columns[8]:'H', df.columns[9]: 'J'}
df = df.rename(columns=mapping)
Run Code Online (Sandbox Code Playgroud)