小编der*_*t71的帖子

我什么时候应该使用 Azure ML Notebooks 和 Azure Databricks?我认为两者都是竞争对手的产品

非常不言自明的问题。我什么时候应该使用 Azure ML Notebooks 和 Azure Databricks?我觉得\xe2\x80\x99s这两种产品之间有很大的重叠,其中一种产品的营销肯定比另一种更好。

\n\n

I\xe2\x80\x99m 主要寻找有关数据集大小和典型工作流程的信息。如果我没有面向 Spark 的工作流程,为什么应该使用 Databricks 而不是 AzureML?

\n\n

谢谢 !

\n

machine-learning azure databricks azure-machine-learning-service

11
推荐指数
1
解决办法
7267
查看次数

fastai - 图像分割的多类度量

I\xe2\x80\x99m 目前正在探索如何使用 fastai 将 Dice 度量应用于多类分割问题。我查了一下概念,发现 Dice 和 F1Score 确实很相似。接下来,我有两个关于它们在fastai.metrics中的实现的问题:

\n\n
    \n
  • dice()和输出有何不同fbeta(beta=1)
  • \n
  • MultiLabelFbeta该类适合多标签图像分割用例吗?
  • \n
  • 如果没有,是否有现有的指标可以帮助我?
  • \n
\n\n

非常感谢您,祝您有美好的一天!

\n

python computer-vision image-segmentation pytorch fast-ai

6
推荐指数
1
解决办法
973
查看次数

从 ADLS2 传输到计算目标的速度非常慢 Azure 机器学习

在计算目标上执行训练脚本期间,我们尝试从 ADLS2 数据存储区下载已注册的数据集。问题是使用以下方法将 ~1.5Gb(分成 ~8500 个文件)下载到计算目标需要几个小时:

from azureml.core import Datastore, Dataset, Run, Workspace

# Retrieve the run context to get Workspace
RUN = Run.get_context(allow_offline=True)

# Retrieve the workspace
ws = RUN.experiment.workspace

# Creating the Dataset object based on a registered Dataset
dataset = Dataset.get_by_name(ws, name='my_dataset_registered')

# Download the Dataset locally
dataset.download(target_path='/tmp/data', overwrite=False)
Run Code Online (Sandbox Code Playgroud)

重要提示:数据集注册到 Datalake 中的一个路径,该路径包含许多子文件夹(以及子子文件夹,..),其中包含大约 170Kb 的小文件。

注意:az copy我可以使用存储资源管理器在几分钟内将完整的数据集下载到本地计算机。此外,数据集是在文件夹阶段定义的,并使用 ** 通配符扫描子文件夹:datalake/relative/path/to/folder/**

这是一个已知问题吗?如何提高传输速度?

谢谢 !

python azure azure-data-lake azure-machine-learning-service azure-data-lake-gen2

5
推荐指数
1
解决办法
690
查看次数