现在我CSV
每次运行脚本时都会导入一个相当大的数据帧.是否有一个很好的解决方案可以保持数据帧在运行之间始终可用,因此我不必花费所有时间等待脚本运行?
我有以下文件:
"j"; "x"; y
"0"; "1"; 5
"1"; "2"; 6
"2"; "3"; 7
"3"; "4"; 8
"4"; "5"; 3
"5"; "5"; 4
Run Code Online (Sandbox Code Playgroud)
我读过的:
df = pd.read_csv('test.csv', delimiter='; ', engine='python')
Run Code Online (Sandbox Code Playgroud)
然后我打印print df
并看到:
"j" "x" y
0 "0" "1" 5
1 "1" "2" 6
2 "2" "3" 7
3 "3" "4" 8
4 "4" "5" 3
5 "5" "5" 4
Run Code Online (Sandbox Code Playgroud)
相反,我想看到:
j x y
0 0 1 5
1 1 2 6
2 2 3 7
3 3 4 8 …
Run Code Online (Sandbox Code Playgroud) 我正在读取一个文件:
pd.read_csv("file.csv", dtype={'ID_1':float})
Run Code Online (Sandbox Code Playgroud)
该文件如下所示:
ID_0, ID_1,ID_2
a,002,c
b,004,d
c, ,e
n,003,g
Run Code Online (Sandbox Code Playgroud)
不幸的是read_csv
,未能抱怨它无法将 ' ' 转换为浮点数。
读取 csv 并将无法转换为浮点数的任何内容转换为 NaN 的正确方法是什么?