如何删除重复的内容?

5 php mysql solr sphinx mongodb

我有一个机密网站(PHP和Mysql),用户可以免费发布广告.但用户经常发布重复的广告.该脚本不允许它们发布完全重复的内容,因此他们通过更改一个或两个字符来完成此操作.

有没有办法找到重复的广告并提醒用户(即使他们修改了文本的某些部分)?

我的网站是PHP和Mysql.我正在使用sphix进行搜索.考虑将此更改为mongodb和apache solr.

Ama*_*jee 0

您可以编写一个函数,将句子分解为单词,然后将每个单词与表进行匹配,然后在数据库中查找匹配百分比。根据百分比您可以做出决定。为了减少数据库检查,您可以删除常用单词和动词,并将其存储在数组中。这是我个人的看法,也许还有其他更好的技术。但我必须说这是一个好问题。