标签: amazon-sagemaker-debugger

get_execution_role() sagemaker:UnknownServiceError:未知服务:“sagemaker-metrics”。有效的服务名称是:accessanalyzer

我正在尝试使用此代码以编程方式获取 iam 角色。

from sagemaker import get_execution_role
get_execution_role()
Run Code Online (Sandbox Code Playgroud)

它给出以下错误。

from sagemaker import get_execution_role
get_execution_role()
Run Code Online (Sandbox Code Playgroud)

我尝试了互联网上的多种解决方案,例如将 sagemaker 和 boto3 升级到最新版本,但没有成功。

我在 sagemaker 笔记本中使用 conda_tensorflow2_py38 内核。

python-3.x amazon-iam amazon-sagemaker amazon-sagemaker-debugger amazon-sagemaker-compilers

9
推荐指数
1
解决办法
5189
查看次数

使用 Apple M1 Pro 实现本地调试/训练的正确配置 AWS SageMaker-Python-SDK 是什么

我想在 AWS SageMaker 上运行 RL 训练作业(脚本如下)。但由于该项目很复杂,我希望在提交到付费实例之前使用 SageMaker 本地模式(在我的 M1 MacBook Pro 中)进行测试运行。然而,即使是简单的训练任务,我也很难让这次本地跑步取得成功。

现在,我在运行本地训练作业时确实使用了 Tensorflow-metal 和 Tensorflow-macos(没有 SageMaker)。我没有看到任何地方可以在 中指定这一点framework_version,而且我也不确定"local_gpu"对于带有 GPU 的普通 Linux 机器来说,哪个是正确的参数,与 Apple Silicon (M1 Pro) 完全匹配。

我到处搜索,但找不到解决此问题的案例。(很奇怪,我做错了什么吗?如果是这样,请纠正我。)如果没有,并且有人知道配置、docker 镜像或使用 M1 Pro 正确完成的示例,请分享。

我尝试运行以下代码。登录后挂起。(如果您尝试运行代码,请尝试使用任何简单的训练脚本作为入口点,并确保使用 awscli 和以下命令使用与您的区域匹配的类似代码登录。 aws ecr get-login-password --region us-east-1 | docker login --username AWS --password-stdin 763104351884.dkr.ecr.us-east-1.amazonaws.com

##main.py
import boto3
import sagemaker
import os
import keras
import numpy as np
from keras.datasets import fashion_mnist
from sagemaker.tensorflow import TensorFlow

sess = sagemaker.Session() 
#role = <'arn:aws:iam::0000000000000:role/CFN-SM-IM-Lambda-Catalog-sk-SageMakerExecutionRole-BlaBlaBla'> #KINDLY ADD …
Run Code Online (Sandbox Code Playgroud)

amazon-web-services tensorflow amazon-sagemaker amazon-sagemaker-debugger

3
推荐指数
1
解决办法
699
查看次数