ste*_*ven 5 python file pandas
我正在研究一些datasets包含许多DateTime变量的内容。.csv我总是在数据清理后保存一个文件。但是,当我下次将文件加载到 pandas 时,我必须dtypes再次转换,并且需要很长时间。因此,我想知道是否有一种类型的文件可以用 Pandas 保存来避免这种情况。
您可以使用 序列化您的对象pickle。值得庆幸的是pandas,它有一个本机函数来序列化和导出数据帧。只需使用导出
df.to_pickle('your_file.pkl')
Run Code Online (Sandbox Code Playgroud)
来自文档: https: //pandas.pydata.org/pandas-docs/stable/ generated/pandas.DataFrame.to_pickle.html
然后,您可以使用再次加载 DataFrame
df = pandas.read_pickle('your_file.pkl')
Run Code Online (Sandbox Code Playgroud)