AMLS 实验运行卡在“正在运行”状态

Art*_*iss 2 python azure neural-network jupyter-notebook azure-machine-learning-service

我使用 Jupyter Notebook 运行了 Azure 机器学习服务实验并记录了神经网络损失。日志记录工作正常,神经网络训练按预期完成。但是,实验卡在运行状态。关闭计算资源不会关闭实验运行,我无法从实验面板取消它。此外,运行没有任何日志文件。

有没有人有同样的行为?跑步现在已经持续了超过 24 小时。

AMLS 实验运行

And*_*son 5

这完全不时发生。这当然令人沮丧,尤其是因为“取消”按钮变灰了。您可以使用 CLI 或 Python SDK 取消运行。

开发工具包

>= 1.16.0

从版本开始,1.16.0Experiment不再需要一个对象。相反,您可以直接使用RunWorkspace对象进行访问

from azureml.core import Workspace, Experiment, Run, VERSION
print("SDK version:", VERSION)

ws = Workspace.from_config()

run = ws.get_run('YOUR_RUN_ID')
run = Run().get(ws, 'YOUR_RUN_ID') # also works
run.cancel()
Run Code Online (Sandbox Code Playgroud)

< 1.16.0

from azureml.core import Workspace, Experiment, Run, VERSION
print("SDK version:", VERSION)

ws = Workspace.from_config()
exp = Experiment(workspace = ws, name = 'YOUR_EXP_NAME')

run = Run(exp, run_id='YOUR STEP RUN ID')

run.cancel() # or run.fail()
Run Code Online (Sandbox Code Playgroud)

命令行界面

此处有更多 CLI 详细信息

az login
az ml run cancel --run YOUR_RUN_ID
Run Code Online (Sandbox Code Playgroud)