小编Wil*_*l H的帖子

在Python / Pandas中创建带有元数据标头和时间序列的csv文件

我正在尝试创建一个csv文件,该文件的前几行中包含元数据,然后是时间序列数据,因此它可以由另一个Web应用程序处理。我的csv文件应如下所示:

Code: ABC1

Frequency: Monthly

Description: Blah Blah

-------------------

2/1/1947    11.7

3/1/1947    11.9
Run Code Online (Sandbox Code Playgroud)

我可以创建一个元数据的csv文件:

metadata=pd.Series([('code: ABC123'),('freqency: monthly'),('description: describecode'),('--------')])

metadata.to_csv("metadata.csv",index=False)
Run Code Online (Sandbox Code Playgroud)

我可以创建时间序列的CSV

a=pd.Series((11.7,11.9),index=pd.date_range('1947-01-02','1947-01-03'))

a.to_csv("data.csv")
Run Code Online (Sandbox Code Playgroud)

但是我不知道如何将它们合并在一起成为顶部的格式。

python csv metadata pandas

5
推荐指数
1
解决办法
1388
查看次数

处理具有混合日期格式的Pandas数据框列

我已经导入了一个具有混合数据格式的CSV文件-一些read_csv可以识别的日期格式,以及一些Excel序列日期时间格式(例如41,866.321)。

导入数据后,列类型显示为对象(给定不同类型的数据),日期(两种类型的格式)都具有dtype字符串。

我想使用to_datetime方法将可识别的字符串日期格式转换为dataframe列中的datetimes,将无法识别的字符串保留为excel格式,然后我可以隔离并更正离线。但是除非我逐行应用该方法(速度太慢),否则它将无法执行此操作。

有谁有解决这个问题的聪明方法?

更新:进行了一些修改后,我找到了这个解决方案,使用coerce = True强制进行列数据类型转换,然后确定可以交叉引用回原始文件的空值。但是,如果有更好的方法(例如,将无法识别的时间戳固定到位),请告诉我。

df1['DateTime']=pd.to_datetime(df1['Time_Date'],coerce=True)
nulls=df1['Time_Date'][df1['Time_Date'].notnull()==False]
Run Code Online (Sandbox Code Playgroud)

python csv datetime pandas

3
推荐指数
1
解决办法
2432
查看次数

标签 统计

csv ×2

pandas ×2

python ×2

datetime ×1

metadata ×1