我有一个像下面这样的Excel
我必须阅读excel并进行一些操作。问题是我必须跳过空行和空列。在上面的示例中,它应该只从 B3:D6 读取。但使用下面的代码,它认为所有空行也如下所示
我正在使用的代码
import pandas as pd
user_input = input("Enter the path of your file: ")
user_input_sheet_master = input("Enter the Sheet name : ")
master = pd.read_excel(user_input,user_input_sheet_master)
print(master.head(5))
Run Code Online (Sandbox Code Playgroud)
如何忽略空行和空列以获得以下输出
ColA ColB ColC
0 10 20 30
1 23 NaN 45
2 NaN 30 50
Run Code Online (Sandbox Code Playgroud)
根据我尝试使用的一些研究df.dropna(how='all'),但它也删除了COLA和COLB。我无法对skiprowsor 的值进行硬编码skipcolumns,因为它每次的格式可能不同。要跳过的行和列的数量可能会有所不同。有时可能没有任何空行或空列。在这种情况下,无需删除任何内容。
你肯定需要使用dropna
df = df.dropna(how='all').dropna(axis=1, how='all')
Run Code Online (Sandbox Code Playgroud)
编辑:
如果我们有以下文件:
然后使用这段代码:
df = df.dropna(how='all').dropna(axis=1, how='all')
Run Code Online (Sandbox Code Playgroud)
new_df看起来如下:
如果我们从以下开始:
并使用完全相同的代码,我得到:
最后,从以下开始:
与第一种情况相同。
| 归档时间: |
|
| 查看次数: |
5426 次 |
| 最近记录: |