Pandas.read_csv“数据意外结束”错误

Rya*_*yan 9 python pandas

我正在尝试使用pd.read_csv()读取数据集时遇到错误。Excel可以很好地打开它。

reviews = pd.read_csv('br.csv')给出错误ParserError:错误标记数据。C错误:从行312074开始的EOF内部字符串

reviews = pd.read_csv('br.csv', engine='python', encoding='utf-8') 返回ParserError:数据意外结束

我该怎么做才能解决此问题?

编辑:这是数据集-https: //www.kaggle.com/gnanesh/goodreads-book-reviews

小智 12

对我来说,添加此修复程序:

error_bad_lines=False

它只是跳过最后一行。所以代替

reviews = pd.read_csv('br.csv', engine='python', encoding='utf-8')

reviews = pd.read_csv('br.csv', engine='python', encoding='utf-8', error_bad_lines=False)

  • `error_bad_lines` 现已弃用,因此您可以使用 `on_bad_lines` 例如 `on_bad_lines='warn'` 或 `on_bad_lines='skip`' 不发出警告,或使用 `on_bad_lines='error'` 生成异常 (2认同)