我使用以下语句创建了我的数据的各个组:
df = pd.read_csv(file_path)
grouped = df.groupby(df.some_parameter)
Run Code Online (Sandbox Code Playgroud)
我想做什么(在伪代码中):
for name, group in grouped:
'Some Text' + name = group
write to csv
Run Code Online (Sandbox Code Playgroud)
最终结果是原始数据集的每个块的单独的.csv文件.
mkl*_*kln 15
你快到了
for name, group in grouped:
group.to_csv(path_to_disk)
Run Code Online (Sandbox Code Playgroud)
这个答案对我非常有帮助-谢谢@mkln。
我只想添加一些特定于我自己的用例的东西,这与文件命名的原始点有关(“某些文本” +名称=组)。
您可以在每个csv文件名中添加名称和其他文本,例如当前日期,因此我将创建一个函数以返回当前日期,然后将其用于文件名。
因此:
from datetime import datetime
def cur_date():
return datetime.now().strftime("%Y-%m-%d")
for name, group in grouped:
group.to_csv('{}_{}.csv'.format(name, cur_date()))
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2244 次 |
| 最近记录: |