计算机视觉 API 和自定义视觉 API 之间的区别

Aye*_*ibi 10 azure-cognitive-services

我对使用 Microsoft 的认知服务还很陌生。我想知道 MS Computer Vision API 和 MS Custom Vision API 有什么区别?

Jon*_*Jon 18

他们都处理图像上的计算机视觉,但希望我能在这里帮助使它们更容易区分。:)

计算机视觉

计算机视觉 API 是 Microsoft 构建自己的图像模型的地方,可以为您提供以下信息:

  • 图像分类- API 将在此处为您提供许多对图像进行分类的标签。它还应该为您提供模型预测图像具有该标签的强度的置信度分数。
  • 内容审核- API 可以为您提供isAdultisRacy标志,以确定图像是否符合这些标准。伴随的信心得分也与这些有关。
  • OCR - API 可以读取图像中的文本并为您提供文本。此 API 还可以处理手写文本,而不仅仅是标志上的文本。
  • 面部识别- 此 API 将识别图像中名人或其他知名人士的面部。
  • 地标识别- 这将识别图像中的地标。

定制视觉

自定义视觉服务有点不同,您可以根据 Microsoft 的预建模型训练自己的图像模型。一方面,这只能做图像分类和物体检测。对象检测部分不仅会告诉您图像是什么标签,还会显示它在图像中的位置。目前,这部分服务处于预览阶段,但到目前为止我已经看到了良好的结果。

另一个区别是自定义视觉服务允许您上传自己的图像。对于图像分类,这意味着您可以上传图像,并为每张图像赋予一个或多个标签。因此,当您通过模型运行图像时,它将返回它认为的标签以及标签的置信度分数。对于对象检测,您执行相同的过程,但您在图像中选择要检测的对象并为其添加标签。

每次上传和标记新图像时,都需要训练模型。从那里您可以评估您的模型的执行情况,为其提供测试图像,甚至使用 REST URL 或 SDK 与之交互。

总结一下,两者最大的区别是Custom Vision服务只能做图像分类和物体检测,以及接收你自己的图像来执行这些。计算机视觉 API 可以做的更多,但您无法控制模型的训练方式。

希望有帮助!如果您有任何问题,请告诉我。