需要自动图像标记API,有什么建议吗?

fjs*_*jsj 6 tagging annotations inference image-processing photo-tagging

我正在构建一个需要拍摄图像并推断与之相关的标签的应用程序.这些标签可以是与图片相关的事物,形容词甚至情感.

我已经找到了ALIPR.但我测试了它,其他一些人测试了它,它表现不佳.ALIPR在15个预测标签的集合中犯了太多错误.至少对于我的应用程序,最好只有几个但正确的标签.

优选地,API应该是基于网络的并且是免费的.有什么建议?

提前致谢!

bjo*_*rnz 4

我认为如果图像可以自动标记,谷歌早就放弃图像标记器了。不幸的是,计算机在理解图像方面存在很多困难。

\n\n

编辑:

\n\n
    \n
  • 如果您对计算机视觉研究感兴趣,请查看CVPapers,尤其是开源计算机视觉实现。自动图像标记还远未得到解决(除非您有一组非常具体/受限的主题)。

  • \n
  • 引自Google Guide 2007 年 3 月 13 日星期二:

    \n\n
    \n

    \xe2\x80\x9cLarry Page\xe2\x80\x9d 和 \xe2\x80\x9cSergey Brin\xe2\x80\x9d 一词出现在 Eric Sc​​hmidt 的图像附近、图像标题或这些图像的链接中。谷歌猜测这些词与图像相关。Google 技术尚未达到可以通过直接查看图像来判断图像中的内容的程度。

    \n
  • \n
\n\n

HTH,不要抱太大希望。

\n\n

PS:我希望你(或其他人)证明我错了,并在这里与我分享;-)

\n\n

编辑2:

\n\n

我刚刚偶然发现了Voc 2010 Challenge,在我看来,它很好地说明了计算机视觉进步的现状。在其中一个挑战中,参赛者必须在图像中(从非常有限的一组对象中)找到一个对象并对其进行分类。在结果页面上您可以看到,其中一种算法能够以 93% 的准确率对飞机进行分类,但在其他类别上“失败”。

\n\n

那只是为了寻找“事物”,甚至不是形容词或情感。

\n