Pandas 显示 Excel 文件的额外未命名列

Question

Pandas 显示 Excel 文件的额外未命名列

我正在开发一个使用 pandas 库的项目，其中我需要读取一个包含以下列的 Excel 文件：

'invoiceid', 'locationid', 'timestamp', 'customerid', 'discount', 'tax',
   'total', 'subtotal', 'productid', 'quantity', 'productprice',
   'productdiscount', 'invoice_products_id', 'producttax',
   'invoice_payments_id', 'paymentmethod', 'paymentdetails', 'amount'

Run Code Online (Sandbox Code Playgroud)

但是当我使用下面的Python代码读取这个文件时：

df_full = pd.read_excel('input/invoiced_products_noinvoiceids_inproduct_v2.0.xlsx', sheet_name=0,)
df_full.head()

Run Code Online (Sandbox Code Playgroud)

它返回一些行和 6unnamed列，其值为NAN。我不知道为什么这些列显示在这里？

以下是请求的示例文件的链接：

https://mega.nz/#!0MlXCBYJ!Oim9RF56h6hUitTwqSG1354dIKLZEgIszzPrVpfHas8

为什么会出现这些额外的列？

Answer 1

roc*_*987 7

正如评论中所讨论的，问题似乎在于，last named列后有额外的数据。这就是为什么你会得到Unnamed专栏。

如果您想删除这些列，可以通过以下方式忽略这些列

df_full = df_full[df_full.filter(regex='^(?!Unnamed)').columns]

Run Code Online (Sandbox Code Playgroud)

归档时间：	8 年，1 月前
查看次数：	7456 次
最近记录：	4 年，6 月前