Akismet在检测垃圾评论方面做得非常出色.但是评论现在并不是垃圾邮件的唯一形式.如果我想像akismet这样的东西在社交网站上自动检测色情图片,允许用户上传他们的照片,头像等怎么办?
已经有一些基于图像的搜索引擎以及面部识别的东西可用,所以我假设它不是火箭科学,它可以做到.但是,我不清楚这些东西是如何工作的,如果我想从头开发它,我该如何处理它.
我应该如何开始?
是否有任何开源项目正在进行中?
目前我们正在举办一场非常好的比赛.不幸的是,我们让所有那些正在运行脚本的作弊者自动投票支持他们的参赛作品.我们已经通过手工查看数据库条目看到了一些作弊者 - 例如,使用相同浏览器的5星评级完全是所有70分钟.现在随着用户群的增长,识别它们变得越来越难.
我们到目前为止做了什么:
有谁知道我们如何使用PHP脚本在我们的数据库中找到模式,或者我们如何更有效地阻止它们?
任何帮助将非常感谢...
我们如何在我们的网站上摆脱这些垃圾邮件?
在某些时候,每个网站都成为垃圾邮件的牺牲品.如何处理它会影响您的客户,大多数解决方案可能会阻止某些人填写您的表单.
这就是蜜罐技术的用武之地.它允许你忽略垃圾邮件而不强迫你的用户填写验证码或跳过其他篮球来填写你的表格.
这篇文章纯粹是为了帮助其他人在他们的网站表单上实现蜜罐陷阱.
自从在我所有客户的网站上实施以下蜜罐以来,我们已成功阻止了99.5%(数千份提交)的所有垃圾邮件.这是不使用"高级"部分中提到的技术,这将很快实施.
我是机器学习的新手,而对于我的第一个项目,我想写一个朴素的贝叶斯垃圾邮件过滤器.我想知道是否有任何公开的标记垃圾邮件/非垃圾邮件的培训集,最好是纯文本而不是关系数据库的转储(除非它们打印那些?).
我知道这种公开可用的数据库存在于其他类型的文本分类中,特别是新闻文章文本.我只是无法为电子邮件找到同样的东西.
其他一些网站使用cURL和假http引用来复制我的网站内容.我们有没有办法检测cURL或不是真正的网络浏览器?
如何检测(使用正则表达式或启发式方法)一个文本字符串中的网站链接,例如注释?
目的是防止垃圾邮件.HTML被剥离,所以我需要检测复制和粘贴的邀请. 垃圾邮件发送者发布链接应该不经济,因为大多数用户无法成功访问该页面.我想要有关最佳实践的建议,参考或讨论.
一些目标:
http://some-fqdn/some/valid/path.ext
)http://
前缀(即有效的FQDN +有效的HTTP路径)当然,我阻止垃圾邮件,但可以使用相同的过程来自动链接文本.
以下是我在想的一些事情.
www .example.com
"吗?普通用户是否知道自己删除空间,或者做任何浏览器"做什么意思"并为你剥离它?我已经阅读了这些内容,现在它们已在此处记录,因此您可以根据需要参考这些问题中的正则表达式.
哇,我在这里列出了一些非常好的启发式方法!对我来说,最好的砰砰声是以下综合:
这应该使垃圾邮件发送者的CPM足够低,以满足我的需求; "旗帜不合适"的用户反馈应该抓住其他任何东西.列出的其他解决方案也非常有用:
我想在我的网站上添加一个简单的联系表单,以便客户可以轻松与我联系.
<form>
NAME
<input type='text' name='name' />
EMAIL
<input type='text' name='email' />
MESSAGE
<textarea name='message' />
<input type='submit' />
</form>
Run Code Online (Sandbox Code Playgroud)
此表单只会通过电子邮件向我发送客户消息.
但是,我也希望减少(不是,我不是说消除但至少减少),垃圾邮件.
我已经研究过使用CAPTCHA,但最终,我不想阻止客户填写额外的信息.
我可以在我的联系表单中使用一个简单的垃圾邮件预防/减少方法的想法.
我想保护我在网页上的电子邮件地址.
但我不懂JavaScript和PHP.我只知道HTML和CSS.
所以,请帮助我如何使用CSS保护我的电子邮件地址.
通过"蜜罐",我的意思或多或少是这种做法:
#Register form
<style>
.hideme{
display:none;
visibility: hidden;
}
</style>
<form action="register.php">
Your email: <input type="text" name="u-email" />
Choose a password: <input type="text" name="passwd" />
<div class="hideme">
Please, leave this field blank: <input type="text" name="email" /> #the comment is for text-browser users
</div>
<input type="submit" value="Register" autocomplete=off />
</form>
//register.php
<?php
if($_POST['email'] != ''){
die("You spammer!");
}
//otherwise, do the form validation and go on.
?>
Run Code Online (Sandbox Code Playgroud)
更多信息在这里.
显然,真实字段是用随机哈希命名的,而蜜罐字段可以有不同的名称(电子邮件,用户,网站,主页等等),这是spambot通常填写的.
我喜欢这种技术,因为它不会导致用户被CAPTCHA烦恼.
你有没有人对这种技术有一些经验?有效吗?