我有一个CSV文件,如下所示:
index,Avg,Min,Max
Build1,56.19,39.123,60.1039
Build2,57.11,40.102,60.2
Build3,55.1134,35.129404123,60.20121
Run Code Online (Sandbox Code Playgroud)
根据我的问题,我可以通过以下简短脚本向此csv添加一些相关信息:
import pandas as pd
df = pd.read_csv('newdata.csv')
print(df)
df_out = pd.concat([df.set_index('index'),df.set_index('index').agg(['max','min','mean'])]).rename(index={'max':'Max','min':'Min','mean':'Average'}).reset_index()
with open('newdata.csv', 'w') as f:
df_out.to_csv(f,index=False)
Run Code Online (Sandbox Code Playgroud)
这将产生以下CSV:
index,Avg,Min,Max
Build1,56.19,39.123,60.1039
Build2,57.11,40.102,60.2
Build3,55.1134,35.129404123,60.20121
Max,57.11,40.102,60.20121
Min,55.1134,35.129404123,60.1039
Average,56.1378,38.1181347077,60.16837
Run Code Online (Sandbox Code Playgroud)
我现在想拥有它,以便可以更新此csv。例如,如果我运行一个新版本(例如build4),则可以添加它,然后重做“最大”,“最小”,“平均”行。我的想法是,因此我删除带有标签Max,Min,Average的行,添加新行,然后重做统计信息。我相信我需要的代码非常简单(仅适用于Max,但也将包含Min和Average行):
df = pd.read_csv('newdata.csv')
df = df.drop('Max')
Run Code Online (Sandbox Code Playgroud)
但是,这始终会导致ValueError:轴中不包含标签['Max']
我已经以崇高的文字创建了csv文件,这可能是问题的一部分吗?我已经阅读了有关此的其他SO帖子,但似乎没有一个对我的问题有所帮助。
我不确定是否允许,但是这里是我的csv的下载链接,以防万一文件本身有问题。
我可以有两个可能的答案:
err*_*ror 10
您必须指定轴参数。默认值是axis = 0,这是行列,是axis = 1。
所以这应该是您的代码
df = df.drop('Max',axis=1)
Run Code Online (Sandbox Code Playgroud)
编辑:看这段代码:
Run Code Online (Sandbox Code Playgroud)df = pd.read_csv('newdata.csv') df = df.drop('Max')
您使用的代码未指定csv文件的第一列包含该数据帧的索引。因此,大熊猫可以即时创建索引。该索引纯粹是数字索引。因此,您的索引不包含“最大”。
尝试以下方法:
df = pd.read_csv("newdata.csv",index_col=0)
df = df.drop("Max",axis=0)
Run Code Online (Sandbox Code Playgroud)
这迫使熊猫将csv文件中的第一列用作索引。这应该意味着代码现在可以正常工作了。
归档时间: |
|
查看次数: |
35194 次 |
最近记录: |