使用Pandas dataframe.to_csv()时,是否可以将缓冲区设置为“ 0”?我仔细阅读了文档,似乎不允许这样做。我在俯视什么吗?
编辑:我问,因为我正在输出的数据帧的大小范围从几百行到几千行(总是具有相同的7列),并且最终检查文件的后续过程有时会失败,因为有时它没有完成被写。
我当然可以引入一个延迟(3-5分钟),但是我宁愿不要随意降低我的代码的速度-我宁愿强迫该代码等待输出完成在继续之前,以及在使用open()写入文件时,能够将缓冲区值设置为0很好。
如果我正确理解你的问题,你可以实施以下内容。此代码片段传递一个StringIO实例作为 的第一个参数to_csv,并调用seek(0):
import StringIO
#### your code here...assuming something like:
#### import pandas as pd
#### data = {"key1":"value1"}
#### dataframe = pd.DataFrame(data, index=dataframe)
buffer = StringIO.StringIO()
dataframe.to_csv(buffer)
buffer.seek(0)
output = buffer.getvalue()
buffer.close()
Run Code Online (Sandbox Code Playgroud)
然后你就可以output随心所欲地进行操纵。