我正在尝试创建一个包含4个空列的csv文件的数据框.当我在LibreOffice或Excel上打开它时,它正确识别空列.然而,打开并pd.read_csv()最终将列的值移动一个.
我怎么解决这个问题?这似乎是熊猫read_csv()方法的一个问题.
我的代码非常标准:
import pandas as pd
df = pd.DataFrame.read_csv('csv_file.csv', sep=',')
df.head()
Run Code Online (Sandbox Code Playgroud)
我改变了标题并使用了这个:
df = pd.DataFrame.read_csv('csv_file.csv', sep=',', index_col=False).
Run Code Online (Sandbox Code Playgroud)
这解决了这个问题,但是我之前的标题中是什么导致了这个问题?
看来你需要参数index_col=False来读取第一列索引read_csv,sep=','参数可以省略,因为它是默认值:
df = pd.read_csv('csv_file.csv', index_col=False)
Run Code Online (Sandbox Code Playgroud)
你的样本:
df = pd.read_csv('teste2.csv', index_col=False)
print (df)
Header1 Header2 Header3 Unnamed: 3 Unnamed: 4 Header4 Header5 Header6 \
0 ptn M00001 0 NaN NaN 2 0 0
Header7 Header8 ... Header22 Header23 Header24 Header25 \
0 0 -31.573 ... -0.375 0.0 -64.168 276.586
Header26 Header27 Unnamed: 29 Unnamed: 30 Header28 Header29
0 -0.232 0.0 NaN NaN 0.702 1.0
[1 rows x 33 columns]
Run Code Online (Sandbox Code Playgroud)
小智 5
我有类似的问题。这是我解决问题的方法:
csv文件pandas.read_csv('filename', sep=',', index_col=False))问题解决了。
| 归档时间: |
|
| 查看次数: |
3027 次 |
| 最近记录: |