相关疑难解决方法(0)

使用Pandas读取带有多个标题的excel表

我有一个excel表,有多个标题,如:

_________________________________________________________________________
____|_____|        Header1    |        Header2     |        Header3      |
ColX|ColY |ColA|ColB|ColC|ColD||ColD|ColE|ColF|ColG||ColH|ColI|ColJ|ColDK|
1   | ds  | 5  | 6  |9   |10  | .......................................
2   | dh  |  ..........................................................
3   | ge  |  ..........................................................
4   | ew  |  ..........................................................
5   | er  |  ..........................................................
Run Code Online (Sandbox Code Playgroud)

现在,您可以看到前两列没有标题,它们是空白的,但其他列的标题如Header1,Header2和Header3.所以我想阅读这张表并将其与其他具有类似结构的表合并.

我想在第一栏'ColX'上合并它.现在我这样做:

import pandas as pd

totalMergedSheet = pd.DataFrame([1,2,3,4,5], columns=['ColX'])
file = pd.ExcelFile('ExcelFile.xlsx')
for i in range (1, len(file.sheet_names)):
    df1 = file.parse(file.sheet_names[i-1])
    df2 = file.parse(file.sheet_names[i])
    newMergedSheet = pd.merge(df1, df2, on='ColX')
    totalMergedSheet = pd.merge(totalMergedSheet, newMergedSheet, on='ColX')
Run Code Online (Sandbox Code Playgroud)

但我不知道它的读取列是否正确,我认为不会以我想要的方式返回结果.所以,我希望得到的框架应该像:

________________________________________________________________________________________________________
____|_____| …
Run Code Online (Sandbox Code Playgroud)

python excel dataframe pandas

9
推荐指数
1
解决办法
2万
查看次数

标签 统计

dataframe ×1

excel ×1

pandas ×1

python ×1