Pandas 显示 Excel 文件的额外未命名列

Abd*_*man 6 python pandas

我正在开发一个使用 pandas 库的项目,其中我需要读取一个包含以下列的 Excel 文件:

'invoiceid', 'locationid', 'timestamp', 'customerid', 'discount', 'tax',
   'total', 'subtotal', 'productid', 'quantity', 'productprice',
   'productdiscount', 'invoice_products_id', 'producttax',
   'invoice_payments_id', 'paymentmethod', 'paymentdetails', 'amount'
Run Code Online (Sandbox Code Playgroud)

但是当我使用下面的Python代码读取这个文件时:

df_full = pd.read_excel('input/invoiced_products_noinvoiceids_inproduct_v2.0.xlsx', sheet_name=0,)
df_full.head()
Run Code Online (Sandbox Code Playgroud)

它返回一些行和 6unnamed列,其值为NAN。我不知道为什么这些列显示在这里?

以下是请求的示例文件的链接:

https://mega.nz/#!0MlXCBYJ!Oim9RF56h6hUitTwqSG1354dIKLZEgIszzPrVpfHas8

为什么会出现这些额外的列?

roc*_*987 7

正如评论中所讨论的,问题似乎在于,last named列后有额外的数据。这就是为什么你会得到Unnamed专栏。

如果您想删除这些列,可以通过以下方式忽略这些列

df_full = df_full[df_full.filter(regex='^(?!Unnamed)').columns]
Run Code Online (Sandbox Code Playgroud)