小编rea*_*kes的帖子

从 SageMaker 将数据帧上传到 AWS S3 Bucket

我是 AWS 环境的新手,正在尝试解决数据流的工作原理。将 CSV 文件从 S3 成功上传到 SageMaker 笔记本实例后,我坚持做相反的事情。

我有一个数据框,想将其作为 CSV 或 JSON 上传到 S3 Bucket。我的代码如下:

bucket='bucketname'
data_key = 'test.csv'
data_location = 's3://{}/{}'.format(bucket, data_key)
df.to_csv(data_location)
Run Code Online (Sandbox Code Playgroud)

我假设因为我pd.read_csv()在加载时成功使用,使用df.to_csv()也可以,但它没有。可能它会产生错误,因为这样我无法在手动将文件上传到 S3 时选择隐私选项。有没有办法将数据从 SageMaker 上传到 S3?

python amazon-s3 amazon-web-services pandas amazon-sagemaker

5
推荐指数
2
解决办法
9165
查看次数

在 AWS SageMaker 上安装 Keras 和 Tensorflow

我正在尝试将 Keras 下载到我在 AWS SageMaker 上的笔记本实例。下面列出了代码和错误或警告:

from keras.models import Sequential #Sequential Models
from keras.layers import Dense #Dense Fully Connected Layer Type
from keras.optimizers import SGD #Stochastic Gradient Descent Optimizer
from keras.callbacks import EarlyStopping
from keras.wrappers.scikit_learn import KerasClassifier
Run Code Online (Sandbox Code Playgroud)

错误:

ModuleNotFoundError: No module named 'tensorflow'
Run Code Online (Sandbox Code Playgroud)

然后我尝试下载 Tensorflow:

!pip install tensorflow
Run Code Online (Sandbox Code Playgroud)

安装完成,注意以下几点:

Installing collected packages: wrapt, tensorflow
Found existing installation: wrapt 1.10.11
    Cannot uninstall 'wrapt'. It is a distutils installed project and thus we cannot accurately determine which files belong to it which …
Run Code Online (Sandbox Code Playgroud)

keras tensorflow amazon-sagemaker

5
推荐指数
1
解决办法
1864
查看次数

将 pandas 数据框上传到谷歌电子表格

我按照此处此处的步骤操作,但无法将 pandas 数据框上传到谷歌表格。

首先我尝试了以下代码:

import gspread
from google.oauth2.service_account import Credentials

scope = ['https://spreadsheets.google.com/feeds',
         'https://www.googleapis.com/auth/drive']

credentials = Credentials.from_service_account_file('my_json_file_name.json', scopes=scope)

gc = gspread.authorize(credentials)

spreadsheet_key = '1FNMkcPz3aLCaWIbrC51lgJyuDFhe2KEixTX1lsdUjOY'
wks_name = 'Sheet1'
d2g.upload(df_qrt, spreadsheet_key, wks_name, credentials=credentials, row_names=True)
Run Code Online (Sandbox Code Playgroud)

上面的代码返回这样的错误消息:AttributeError: module 'df2gspread' has no attribute 'upload'这是没有意义的,因为 df2spread 确实有一个名为 upload 的函数。

其次,我尝试将数据附加到我通过输入列名称在谷歌工作表上人为创建的数据框中。这也不起作用,也没有提供任何结果。

import gspread_dataframe as gd

ws = gc.open("name_of_file").worksheet("Sheet1")
existing = gd.get_as_dataframe(ws)
updated = existing.append(df_qrt)
gd.set_with_dataframe(ws, updated)
Run Code Online (Sandbox Code Playgroud)

任何帮助将不胜感激,谢谢!

python google-sheets pandas gspread google-sheets-api

5
推荐指数
1
解决办法
9529
查看次数

添加一个新列,指示 mysql 中的行号

我在 MySQL 中有一个表,例如:

hiredate
2020-02-03
2019-12-03
2018-08-07
Run Code Online (Sandbox Code Playgroud)

我想在它旁边添加一个新列并显示索引号:

hiredate     no
2020-02-03   1
2019-12-03   2
2018-08-07   3
Run Code Online (Sandbox Code Playgroud)

我怎样才能做到这一点?

mysql sql window-functions

2
推荐指数
1
解决办法
2344
查看次数