有免费的反垃圾邮件数据库吗?

Pra*_*yan 5 spam-prevention

Wordpress有一个名为Akismet的垃圾邮件过滤插件,它似乎能够将任何文本块分类为垃圾邮件.唯一需要注意的是,您需要通过他们的界面和他们的数据库/算法不是开源的或随时可用的.

还有商业提供商为您提供Web可访问的API,以便对Web应用程序中用户提交的电子邮件,评论或任何其他文本进行分类.

是否有任何类型的开源或可自由访问的数据库可以将一块文本分类为垃圾邮件/非垃圾邮件?

编辑:这是对我想要的更清楚的解释

基本上我希望有一个广泛的数据库,其中某些短语的概率是垃圾邮件.由于(我假设)垃圾邮件发送者垃圾邮件所有电子邮件地址同等,通过使用此数据库预先填充我的贝叶斯垃圾邮件过滤器,我可以创建一个应用程序,通过捕获大多数垃圾邮件而不需要任何用户培训.

Jon*_*way 1

根据评论更新:

我认为简单的数据库无法解决这个问题。大多数垃圾邮件是通过算法生成的(例如,垃圾评论通常包含帖子中的内容)。Akismet 会做一些事情的组合,可能包括链接分析和使用已知的垃圾邮件签名,但他们不发布它。

我读过一些有趣的人工智能项目来对好的内容而不是坏的内容进行分类。您还可以查看Spam Karma,它根据各种垃圾邮件触发器(加载页面后立即发布响应等)来分析博客评论。


原始答案(DNS黑名单):