我是 AWS 环境的新手,正在尝试解决数据流的工作原理。将 CSV 文件从 S3 成功上传到 SageMaker 笔记本实例后,我坚持做相反的事情。
我有一个数据框,想将其作为 CSV 或 JSON 上传到 S3 Bucket。我的代码如下:
bucket='bucketname'
data_key = 'test.csv'
data_location = 's3://{}/{}'.format(bucket, data_key)
df.to_csv(data_location)
Run Code Online (Sandbox Code Playgroud)
我假设因为我pd.read_csv()在加载时成功使用,使用df.to_csv()也可以,但它没有。可能它会产生错误,因为这样我无法在手动将文件上传到 S3 时选择隐私选项。有没有办法将数据从 SageMaker 上传到 S3?
python amazon-s3 amazon-web-services pandas amazon-sagemaker
我正在尝试将 Keras 下载到我在 AWS SageMaker 上的笔记本实例。下面列出了代码和错误或警告:
from keras.models import Sequential #Sequential Models
from keras.layers import Dense #Dense Fully Connected Layer Type
from keras.optimizers import SGD #Stochastic Gradient Descent Optimizer
from keras.callbacks import EarlyStopping
from keras.wrappers.scikit_learn import KerasClassifier
Run Code Online (Sandbox Code Playgroud)
错误:
ModuleNotFoundError: No module named 'tensorflow'
Run Code Online (Sandbox Code Playgroud)
然后我尝试下载 Tensorflow:
!pip install tensorflow
Run Code Online (Sandbox Code Playgroud)
安装完成,注意以下几点:
Installing collected packages: wrapt, tensorflow
Found existing installation: wrapt 1.10.11
Cannot uninstall 'wrapt'. It is a distutils installed project and thus we cannot accurately determine which files belong to it which …Run Code Online (Sandbox Code Playgroud) 我按照此处和此处的步骤操作,但无法将 pandas 数据框上传到谷歌表格。
首先我尝试了以下代码:
import gspread
from google.oauth2.service_account import Credentials
scope = ['https://spreadsheets.google.com/feeds',
'https://www.googleapis.com/auth/drive']
credentials = Credentials.from_service_account_file('my_json_file_name.json', scopes=scope)
gc = gspread.authorize(credentials)
spreadsheet_key = '1FNMkcPz3aLCaWIbrC51lgJyuDFhe2KEixTX1lsdUjOY'
wks_name = 'Sheet1'
d2g.upload(df_qrt, spreadsheet_key, wks_name, credentials=credentials, row_names=True)
Run Code Online (Sandbox Code Playgroud)
上面的代码返回这样的错误消息:AttributeError: module 'df2gspread' has no attribute 'upload'这是没有意义的,因为 df2spread 确实有一个名为 upload 的函数。
其次,我尝试将数据附加到我通过输入列名称在谷歌工作表上人为创建的数据框中。这也不起作用,也没有提供任何结果。
import gspread_dataframe as gd
ws = gc.open("name_of_file").worksheet("Sheet1")
existing = gd.get_as_dataframe(ws)
updated = existing.append(df_qrt)
gd.set_with_dataframe(ws, updated)
Run Code Online (Sandbox Code Playgroud)
任何帮助将不胜感激,谢谢!
我在 MySQL 中有一个表,例如:
hiredate
2020-02-03
2019-12-03
2018-08-07
Run Code Online (Sandbox Code Playgroud)
我想在它旁边添加一个新列并显示索引号:
hiredate no
2020-02-03 1
2019-12-03 2
2018-08-07 3
Run Code Online (Sandbox Code Playgroud)
我怎样才能做到这一点?