Emi*_*ebb 4 java image-processing duplicate-removal cbir phash
我需要搜索一个巨大的图像数据库以使用 pHash 查找可能的重复项,假设这些图像记录具有使用 pHash 生成的哈希码。
现在我必须比较一个新图像,我必须使用 pHash 针对现有记录为此创建哈希。但根据我的理解,有比较并不像
hash1 - has2 < threshold
Run Code Online (Sandbox Code Playgroud)
看起来我需要将两个哈希码传递到 pHash API 中进行匹配。所以我必须从数据库中批量检索所有哈希码并使用 pHash API 一一比较。
但是如果我有大约 1000 张图像在队列中与数百万已经存在的图像进行比较,这看起来不是最好的方法。
我需要知道以下内容。
提前致谢。
我认为在 pHash 支持论坛上讨论了这个问题的某些部分。
您将需要使用 mvptree 存储机制
http://lists.phash.org/htdig.cgi/phash-support-phash.org/2011-May/000122.html 和 http://lists.phash.org/htdig.cgi/phash-support-phash。 org/2010-October/000103.html
| 归档时间: |
|
| 查看次数: |
2703 次 |
| 最近记录: |