我正在使用熊猫来读取 excel 文件。它没有列名,但它继续读取第一行作为列名。
以下是正在读取的excel文件。
data1 0.994676
data2 0.994588
data3 0.99488
data4 0.994483
data5 0.994312
data6 0.993823
data7 0.993575
data8 0.994231
data9 0.993838
data10 0.994007
data11 0.994328
data12 0.993503
data13 0.99342
data14 0.992729
data15 0.993013
data16 0.993049
data17 0.993133
data18 0.99262
Run Code Online (Sandbox Code Playgroud)
我正在使用以下代码阅读第二列。将熊猫导入为 pd
df=pd.ExcelFile('C:/Users/JohnDoe/Desktop/080718_output.xlsx', header=None, index_col=False).parse('Data_sheet')
y=df.iloc[0:17,1]
Run Code Online (Sandbox Code Playgroud)
以下是y。
In[38]:y
Out[38]:
0 0.994588
1 0.994880
2 0.994483
3 0.994312
4 0.993823
5 0.993575
6 0.994231
7 0.993838
8 0.994007
9 0.994328
10 0.993503
11 0.993420
12 0.992729
13 0.993013
14 0.993049
15 0.993133
16 0.992620
Name: 0.994676, dtype: float64
Run Code Online (Sandbox Code Playgroud)
它跳过了第一个数据,因为第一行被用作列名。关于如何改进这一点有什么想法吗?
编辑:'header=False' 到 'header=None'。两种情况给出相同的结果。
jez*_*ael 10
您可以将read_excelwithheader=None用于默认列rangeIndex:
df = pd.read_excel('file.xlsx',
sheet_name ='Data_sheet',
header=None,
index_col=False)
Run Code Online (Sandbox Code Playgroud)
小智 2
创建一个列标题变量并在 excel 读入语句中调用该变量并声明 header=None
names=['Column1','Column2']
df=pd.read_excel(r"/Users/JohnDoe/Desktop/080718_output.xlsx",header=None,names=names)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
19645 次 |
| 最近记录: |