AWS ECS 任务错误 - 可用 GPU 资源不足

smb*_*ina 5 gpu amazon-web-services amazon-ecs

当我发布一个包含具有下一个 GPU 要求的任务(所需计数 1)的服务时,我在启动类型为 EC2 的 AWS ECS 集群上收到以下错误:

    "resourceRequirements": [
            {
              "type":"GPU",
              "value": "1"
            }
    ]
Run Code Online (Sandbox Code Playgroud)

错误消息: 服务 XXXXXXX 无法放置任务,因为没有容器实例满足其所有要求。最接近的匹配容器实例 YYYYYYYYY 的可用 GPU 资源不足。

连接到集群的EC2实例是p2.8xlarge,有8个GPU,这应该足以满足我的要求。

欢迎提供有关 ECS 如何计算这些要求的任何帮助或信息。

谢谢