The*_*Jon 2 python excel pandas
我有一个大约500,000行的excel文件,我想将它拆分为几个excel文件,每个文件有50,000行.
我想用熊猫这样做,所以它将是最快捷,最简单的.
任何想法如何制作它?
谢谢您的帮助
假设您的Excel文件只有一个(第一张)包含数据的表格,我会使用chunksize参数:
import pandas as pd
i=0
for df in pd.read_excel(file_name, chunksize=50000):
df.to_excel('/path/to/file_{:02d}.xlsx'.format(i), index=False)
i += 1
Run Code Online (Sandbox Code Playgroud)
更新:
chunksize = 50000
df = pd.read_excel(file_name)
for chunk in np.split(df, len(df) // chunksize):
chunk.to_excel('/path/to/file_{:02d}.xlsx'.format(i), index=False)
Run Code Online (Sandbox Code Playgroud)