xRo*_*bot 13 algorithm image-processing
我正在创建一个搜索引擎(用于学习),我想知道Google如何使用Safesearch(http://en.wikipedia.org/wiki/Safesearch)识别成人内容和图像.
程序语言并不重要,我只想知道通用程序语言的方法.
Ben*_*igt 14
如果任何类型的内容过滤器的规则落入试图通过过滤器获取该内容的人手中,则过滤器将变得无效.
因此,我认为Google的规则(1)不公开,(2)经常更改.
也就是说,从一个小的成人网站黑名单开始,并跟随外向链接(和/或找到链接到黑名单网站的网站)可能会发现大量的成人网站.但绝不是全部,你还需要某种文本处理和图像识别算法.
注意:一个流行的理论是,成人内容提供商付费给人们在stackoverflow.com上提问,这样Jon Skeet和Marc Gravell将有更少的时间来更新安全搜索过滤器.然而,很容易证明Jon和Marc以如此高的速度回答问题,任何这样的策略在经济上都不可行.