标签: spam-prevention

以编程方式检测色情图片的最佳方法是什么?

Akismet在检测垃圾评论方面做得非常出色.但是评论现在并不是垃圾邮件的唯一形式.如果我想像akismet这样的东西在社交网站上自动检测色情图片,允许用户上传他们的照片,头像等怎么办?

已经有一些基于图像的搜索引擎以及面部识别的东西可用,所以我假设它不是火箭科学,它可以做到.但是,我不清楚这些东西是如何工作的,如果我想从头开发它,我该如何处理它.

我应该如何开始?

是否有任何开源项目正在进行中?

spam-prevention

120
推荐指数
9
解决办法
11万
查看次数

在投票比赛中狩猎作弊者

目前我们正在举办一场非常好的比赛.不幸的是,我们让所有那些正在运行脚本的作弊者自动投票支持他们的参赛作品.我们已经通过手工查看数据库条目看到了一些作弊者 - 例如,使用相同浏览器的5星评级完全是所有70分钟.现在随着用户群的增长,识别它们变得越来越难.

我们到目前为止做了什么:

  1. 我们存储IP和浏览器并将该组合阻止为一小时的时间范围.Cookies不会对这些人有所帮助.
  2. 我们也在使用Captcha,它已被破坏

有谁知道我们如何使用PHP脚本在我们的数据库中找到模式,或者我们如何更有效地阻止它们?

任何帮助将非常感谢...

php voting spam-prevention

63
推荐指数
3
解决办法
3649
查看次数

更好的蜜罐实施(形式反垃圾邮件)

我们如何在我们的网站上摆脱这些垃圾邮件?

在某些时候,每个网站都成为垃圾邮件的牺牲品.如何处理它会影响您的客户,大多数解决方案可能会阻止某些人填写您的表单.

这就是蜜罐技术的用武之地.它允许你忽略垃圾邮件而不强迫你的用户填写验证码或跳过其他篮球来填写你的表格.

这篇文章纯粹是为了帮助其他人在他们的网站表单上实现蜜罐陷阱.


更新:

自从在我所有客户的网站上实施以下蜜罐以来,我们已成功阻止了99.5%(数千份提交)的所有垃圾邮件.这是不使用"高级"部分中提到的技术,这将很快实施.

forms spam-prevention honeypot

49
推荐指数
3
解决办法
4万
查看次数

公开可用的垃圾邮件过滤器培训集

我是机器学习的新手,而对于我的第一个项目,我想写一个朴素的贝叶斯垃圾邮件过滤器.我想知道是否有任何公开的标记垃圾邮件/非垃圾邮件的培训集,最好是纯文本而不是关系数据库的转储(除非它们打印那些?).

我知道这种公开可用的数据库存在于其他类型的文本分类中,特别是新闻文章文本.我只是无法为电子邮件找到同样的东西.

machine-learning spam-prevention training-data

39
推荐指数
4
解决办法
5万
查看次数

如何检测虚假用户(crawlers)和cURL

其他一些网站使用cURL和假http引用来复制我的网站内容.我们有没有办法检测cURL或不是真正的网络浏览器?

php curl spam-prevention

39
推荐指数
1
解决办法
2万
查看次数

检测文本字符串中的(顽皮或漂亮)URL或链接

如何检测(使用正则表达式或启发式方法)一个文本字符串中的网站链接,例如注释?

目的是防止垃圾邮件.HTML被剥离,所以我需要检测复制和粘贴的邀请. 垃圾邮件发送者发布链接应该不经济,因为大多数用户无法成功访问该页面.我想要有关最佳实践的建议,参考或讨论.

一些目标:

  • 结构良好的URL(http://some-fqdn/some/valid/path.ext)
  • URL但没有http://前缀(即有效的FQDN +有效的HTTP路径)
  • 任何其他有趣的业务

当然,我阻止垃圾邮件,但可以使用相同的过程来自动链接文本.

思路

以下是我在想的一些事情.

  • 内容是母语散文,所以我可以在检测中触发快乐
  • 我应该首先删除所有空格,以便抓住" www .example.com"吗?普通用户是否知道自己删除空间,或者做任何浏览器"做什么意思"并为你剥离它?
  • 也许多次通过是更好的策略,扫描:
    • 格式良好的网址
    • 所有非空格后跟'.' 随后是任何有效的TLD
    • 还要别的吗?

相关问题

我已经阅读了这些内容,现在它们已在此处记录,因此您可以根据需要参考这些问题中的正则表达式.

更新和摘要

哇,我在这里列出了一些非常好的启发式方法!对我来说,最好的砰砰声是以下综合:

  1. @Jon Bright检测TLD的技术(一个很好的防御性阻塞点)
  2. 对于那些可疑的字符串,请根据@capar将点替换为带点的字符
  3. 一个好看的字符是@ Sharkey的下标· (即" · ").· 也是一个单词边界,因此随便复制和粘贴更难.

这应该使垃圾邮件发送者的CPM足够低,以满足我的需求; "旗帜不合适"的用户反馈应该抓住其他任何东西.列出的其他解决方案也非常有用:

  • 剥去所有虚线四边形(@ Sharkey对自己答案的评论)
  • @ Sporkmonger对客户端Javascript的要求,它在表单中插入了一个必需的隐藏字段.
  • 对URL服务器端进行Ping操作以确定它是否是网站.(也许我可以按照@Nathan通过SpamAssassin或其他贝叶斯过滤器运行HTML ..)
  • 查看Chrome的智能地址栏来源,了解Google使用的巧妙技巧
  • 呼叫OWASP AntiSAMY或其他Web服务以进行垃圾邮件/恶意软件检测.

language-agnostic url sanitization spam-prevention

37
推荐指数
4
解决办法
7010
查看次数

垃圾邮件预防/减少 - 联系表格?

我想在我的网站上添加一个简单的联系表单,以便客户可以轻松与我联系.

<form>
    NAME
    <input type='text' name='name' />
    EMAIL
    <input type='text' name='email' />
    MESSAGE
    <textarea name='message' />
    <input type='submit' />
</form>
Run Code Online (Sandbox Code Playgroud)

此表单只会通过电子邮件向我发送客户消息.

但是,我也希望减少(不是,我不是说消除但至少减少),垃圾邮件.

我已经研究过使用CAPTCHA,但最终,我不想阻止客户填写额外的信息.

我可以在我的联系表单中使用一个简单的垃圾邮件预防/减少方法的想法.

html javascript spam-prevention

33
推荐指数
4
解决办法
2万
查看次数

仅使用CSS保护电子邮件地址

我想保护我在网页上的电子邮件地址.

但我不懂JavaScript和PHP.我只知道HTML和CSS.

所以,请帮助我如何使用CSS保护我的电子邮件地址.

html css email-address spam-prevention css3

30
推荐指数
5
解决办法
2万
查看次数

蜜罐技术对垃圾邮件的效果如何?

通过"蜜罐",我的意思或多或少是这种做法:

#Register form
<style>
    .hideme{
        display:none;
        visibility: hidden;
    }
</style>
<form action="register.php">
    Your email: <input type="text" name="u-email" />
    Choose a password: <input type="text" name="passwd" />
    <div class="hideme">
        Please, leave this field blank: <input type="text" name="email" />  #the comment is for text-browser users
    </div>
    <input type="submit" value="Register" autocomplete=off />
</form>

//register.php
<?php
if($_POST['email'] != ''){
    die("You spammer!");
}
//otherwise, do the form validation and go on.
?>
Run Code Online (Sandbox Code Playgroud)

更多信息在这里.

显然,真实字段是用随机哈希命名的,而蜜罐字段可以有不同的名称(电子邮件,用户,网站,主页等等),这是spambot通常填写的.

我喜欢这种技术,因为它不会导致用户被CAPTCHA烦恼.

你有没有人对这种技术有一些经验?有效吗?

php spam-prevention spam honeypot

29
推荐指数
4
解决办法
2万
查看次数

当机器人攻击!

除了CAPTCHA之外,有哪些流行的垃圾邮件预防方法?

security captcha bots spam-prevention

26
推荐指数
7
解决办法
3902
查看次数