如何访问 azureml FileDataSet 中的文件(图像)?

Sam*_*tte 5 python azure-machine-learning-service

我已将一个大型 (10+GB) 数据集上传到 Azure Blob 存储中,其中包含数千张图像 (jpg) 格式。
我在 Azure 机器学习服务中将 blob 容器注册为数据存储,还注册了一个文件数据集,指向包含图像的实际 blob 容器。(显示有 44440 张图像)。

现在,我想运行一个笔记本(在 AzureML 中),它需要读取特定图像并将其加载到图像中(使用cv2.imread())。但是,我似乎没有找到合适的文档...我看到的唯一选择是将整个数据集下载到本地临时存储上,我不喜欢这样做(多个千兆字节)。

是否有一个选项可以用来访问实际的文件引用并将其传递给我的第 3 方方法?

您可以在下面找到一些相关的代码:

# get workspace and datastore
ws = Workspace.from_config()
dstore = ws.datastores[datastore_name]
image_dataset = ws.datasets[image_dataset_name]

mounted_images = image_dataset.mount() 

img = cv2.imread(mounted_images['my_file_name.jpg']) # this will not work
Run Code Online (Sandbox Code Playgroud)

关于如何让它发挥作用有什么想法吗?

谢谢

Dan*_*der 5

dataset.mount() 实际上返回一个具有 mount_point 属性的 MountContext。

\n\n

所以:

\n\n

img = cv2.imread(mounted_images.mount_point +\xe2\x80\x99/my_file_name.jpg')

\n\n

应该有希望工作。

\n