rgi*_*isi 3 object-recognition firebase-mlkit google-mlkit
我想识别并计算图片中的对象,例如计算社区图片中的房屋数量。使用 ML Kit 执行此操作的最佳方法是什么?
我需要使用对象检测 API吗?或者是否可以使用直接的图像标签获得多个“房屋”标签?
小智 6
ML Kit 对象检测 API(请注意,它现在作为独立 SDK 提供)可以对图像/视频流中的对象进行计数,但仅限于 5 个最大的对象。此外,您还应该评估对象检测是否适合您的用例。它是一个非常通用的定位器,适用于大多数对象,但是当对象靠近/重叠时,它可能无法区分它们。
如果您需要检测超过 5 个对象,我建议您直接使用TensorFlow Lite和TF Hub上提供的一些预训练模型,或者如果通用模型不适合您的用例,请使用AutoML Vision Edge自行训练一个。
Fwiw,图像标签分配描述图像场景的标签。但是,它不会计算对象的数量,您通常会得到一个标签“房子”。
| 归档时间: |
|
| 查看次数: |
1091 次 |
| 最近记录: |