将 pandas 数据框上传到谷歌电子表格

rea*_*kes 5 python google-sheets pandas gspread google-sheets-api

我按照此处此处的步骤操作,但无法将 pandas 数据框上传到谷歌表格。

首先我尝试了以下代码:

import gspread
from google.oauth2.service_account import Credentials

scope = ['https://spreadsheets.google.com/feeds',
         'https://www.googleapis.com/auth/drive']

credentials = Credentials.from_service_account_file('my_json_file_name.json', scopes=scope)

gc = gspread.authorize(credentials)

spreadsheet_key = '1FNMkcPz3aLCaWIbrC51lgJyuDFhe2KEixTX1lsdUjOY'
wks_name = 'Sheet1'
d2g.upload(df_qrt, spreadsheet_key, wks_name, credentials=credentials, row_names=True)
Run Code Online (Sandbox Code Playgroud)

上面的代码返回这样的错误消息:AttributeError: module 'df2gspread' has no attribute 'upload'这是没有意义的,因为 df2spread 确实有一个名为 upload 的函数。

其次,我尝试将数据附加到我通过输入列名称在谷歌工作表上人为创建的数据框中。这也不起作用,也没有提供任何结果。

import gspread_dataframe as gd

ws = gc.open("name_of_file").worksheet("Sheet1")
existing = gd.get_as_dataframe(ws)
updated = existing.append(df_qrt)
gd.set_with_dataframe(ws, updated)
Run Code Online (Sandbox Code Playgroud)

任何帮助将不胜感激,谢谢!

Suy*_*pte 4

您没有正确导入包。

只要这样做

from df2gspread import df2gspread as d2g
Run Code Online (Sandbox Code Playgroud)

当您使用将工作表转换为数据框时

existing = gd.get_as_dataframe(ws)
Run Code Online (Sandbox Code Playgroud)

工作表中的所有空白列和行现在都是数据帧的一部分,其值为 NaN,因此当您尝试将其附加到另一个数据帧时,它不会被附加,因为列不匹配。相反,尝试将工作表转换为数据框

existing = pd.DataFrame(ws.get_all_records())
Run Code Online (Sandbox Code Playgroud)

当您在 Google Sheets 中导出数据框时,数据框的索引存储在第一列中(这发生在我的情况下,无法确定)。如果第一列是索引,那么您可以使用删除该列

existing.drop([''],axis=1,inplace=True)
Run Code Online (Sandbox Code Playgroud)

然后这将正常工作。

updated = existing.append(df_qrt)
gd.set_with_dataframe(ws, updated)
Run Code Online (Sandbox Code Playgroud)