Pandas:要保存以包含数据类型的文件类型

ste*_*ven 5 python file pandas

我正在研究一些datasets包含许多DateTime变量的内容。.csv我总是在数据清理后保存一个文件。但是,当我下次将文件加载到 pandas 时,我必须dtypes再次转换,并且需要很长时间。因此,我想知道是否有一种类型的文件可以用 Pandas 保存来避免这种情况。

kos*_*nik 6

您可以使用 序列化您的对象pickle。值得庆幸的是pandas,它有一个本机函数来序列化和导出数据帧。只需使用导出

df.to_pickle('your_file.pkl')
Run Code Online (Sandbox Code Playgroud)

来自文档: https: //pandas.pydata.org/pandas-docs/stable/ generated/pandas.DataFrame.to_pickle.html

然后,您可以使用再次加载 DataFrame

df = pandas.read_pickle('your_file.pkl')
Run Code Online (Sandbox Code Playgroud)

  • 一个可能的缺点是我相信用一个版本的 Pandas 保存 pkl 并用另一个版本打开它会发出警告。它也可能有意外行为(?否则警告一开始就不会存在) (2认同)