我正在尝试使用pandas来操作.csv文件,但是我收到此错误:
pandas.parser.CParserError:标记数据时出错.C错误:第3行预计有2个字段,见12
我曾尝试阅读熊猫文档,但一无所获.
我的代码很简单:
path = 'GOOG Key Ratios.csv'
#print(open(path).read())
data = pd.read_csv(path)
Run Code Online (Sandbox Code Playgroud)
我该如何解决这个问题?我应该使用该csv模块还是其他语言?
档案来自晨星
所以我有一个看起来像这样的CSV:
1 | 01-01-2019 | 724
2 | 01-01-2019 | 233 | 436
3 | 01-01-2019 | 345
4 | 01-01-2019 | 803 | 933 | 943 | 923 | 954
5 | 01-01-2019 | 454
...
Run Code Online (Sandbox Code Playgroud)
当我尝试使用以下代码生成dataFrame时。
df = pd.read_csv('data.csv', header=0, engine='c', error_bad_lines=False)
Run Code Online (Sandbox Code Playgroud)
它仅将3列的行添加到df(上方的第1、3和5行)
其余的被认为是“坏线”,给我以下错误:
Skipping line 17467: expected 3 fields, saw 9
Run Code Online (Sandbox Code Playgroud)
如何创建包含csv中所有数据的数据框,可能只是用null填充空单元格?还是在添加到df之前必须声明最大行长?
谢谢!
gnuplot中是否有一个函数返回csv文件中的列数?我在文档中找不到任何内容,也许有人可以为此提出自定义功能?