小编Wil*_*l H的帖子

我正在尝试创建一个csv文件，该文件的前几行中包含元数据，然后是时间序列数据，因此它可以由另一个Web应用程序处理。我的csv文件应如下所示：

Code: ABC1

Frequency: Monthly

Description: Blah Blah

-------------------

2/1/1947    11.7

3/1/1947    11.9

我可以创建一个元数据的csv文件：

metadata=pd.Series([('code: ABC123'),('freqency: monthly'),('description: describecode'),('--------')])

metadata.to_csv("metadata.csv",index=False)

我可以创建时间序列的CSV

a=pd.Series((11.7,11.9),index=pd.date_range('1947-01-02','1947-01-03'))

a.to_csv("data.csv")

但是我不知道如何将它们合并在一起成为顶部的格式。

5
推荐指数

1
解决办法

1388
查看次数

我已经导入了一个具有混合数据格式的CSV文件-一些read_csv可以识别的日期格式，以及一些Excel序列日期时间格式（例如41,866.321）。

导入数据后，列类型显示为对象（给定不同类型的数据），日期（两种类型的格式）都具有dtype字符串。

我想使用to_datetime方法将可识别的字符串日期格式转换为dataframe列中的datetimes，将无法识别的字符串保留为excel格式，然后我可以隔离并更正离线。但是除非我逐行应用该方法（速度太慢），否则它将无法执行此操作。

有谁有解决这个问题的聪明方法？

更新：进行了一些修改后，我找到了这个解决方案，使用coerce = True强制进行列数据类型转换，然后确定可以交叉引用回原始文件的空值。但是，如果有更好的方法（例如，将无法识别的时间戳固定到位），请告诉我。

df1['DateTime']=pd.to_datetime(df1['Time_Date'],coerce=True)
nulls=df1['Time_Date'][df1['Time_Date'].notnull()==False]

3
推荐指数

1
解决办法

2432
查看次数

csv ×2

小编Wil_l H的帖子