这个问题可能有一个简单的答案,但是在读取一个非常大的 csv 文件时,有很多行有一个额外的列。根据数据集的条件,我知道我可以使用 忽略这些行error_bad_lines = False,但是,当我这样做时,它会将每个实例报告给 shell,这会带来很多不必要的混乱。有没有办法禁用报告,或者配置熊猫来接受这些行,但只接受前三列?
read_csv您可能应该设置一些参数。例如,切换 error_bad_lines 和 warn_bad_lines 将关闭 stdout 错误消息。如果您只想阅读前三列,请按如下所示设置 usecols:
from pandas import read_csv
read_csv(filename, usecols=[0:3], error_bad_lines=False, warn_bad_lines=False)
Run Code Online (Sandbox Code Playgroud)