熊猫-放置功能错误(标签未包含在轴中)

Abd*_*ll 8 python pandas

我有一个CSV文件,如下所示:

index,Avg,Min,Max
Build1,56.19,39.123,60.1039
Build2,57.11,40.102,60.2
Build3,55.1134,35.129404123,60.20121
Run Code Online (Sandbox Code Playgroud)

根据我的问题我可以通过以下简短脚本向此csv添加一些相关信息:

import pandas as pd

df = pd.read_csv('newdata.csv')
print(df)

df_out = pd.concat([df.set_index('index'),df.set_index('index').agg(['max','min','mean'])]).rename(index={'max':'Max','min':'Min','mean':'Average'}).reset_index()

with open('newdata.csv', 'w') as f:
    df_out.to_csv(f,index=False)
Run Code Online (Sandbox Code Playgroud)

这将产生以下CSV:

index,Avg,Min,Max
Build1,56.19,39.123,60.1039
Build2,57.11,40.102,60.2
Build3,55.1134,35.129404123,60.20121
Max,57.11,40.102,60.20121
Min,55.1134,35.129404123,60.1039
Average,56.1378,38.1181347077,60.16837
Run Code Online (Sandbox Code Playgroud)

我现在想拥有它,以便可以更新此csv。例如,如果我运行一个新版本(例如build4),则可以添加它,然后重做“最大”,“最小”,“平均”行。我的想法是,因此我删除带有标签Max,Min,Average的行,添加新行,然后重做统计信息。我相信我需要的代码非常简单(仅适用于Max,但也将包含Min和Average行):

df = pd.read_csv('newdata.csv')
df = df.drop('Max')
Run Code Online (Sandbox Code Playgroud)

但是,这始终会导致ValueError:轴中不包含标签['Max']

我已经以崇高的文字创建了csv文件,这可能是问题的一部分吗?我已经阅读了有关此的其他SO帖子,但似乎没有一个对我的问题有所帮助。

我不确定是否允许,但是这里是我的csv下载链接,以防万一文件本身有问题。

我可以有两个可能的答案:

  1. 如何解决此问题
  2. 如何添加更多构建并更新统计信息(一种不带删除的方法)

err*_*ror 10

您必须指定轴参数。默认值是axis = 0,这是行列,是axis = 1。

所以这应该是您的代码

df = df.drop('Max',axis=1)
Run Code Online (Sandbox Code Playgroud)

编辑:看这段代码:

df = pd.read_csv('newdata.csv')
df = df.drop('Max')
Run Code Online (Sandbox Code Playgroud)

您使用的代码未指定csv文件的第一列包含该数据帧的索引。因此,大熊猫可以即时创建索引。该索引纯粹是数字索引。因此,您的索引不包含“最大”。

尝试以下方法:

df = pd.read_csv("newdata.csv",index_col=0)
df = df.drop("Max",axis=0)
Run Code Online (Sandbox Code Playgroud)

这迫使熊猫将csv文件中的第一列用作索引。这应该意味着代码现在可以正常工作了。


gle*_*oux 6

删除熊猫中的特定列;简单地做:

del df['Max']
Run Code Online (Sandbox Code Playgroud)