标签: spam

用于从有意义的文本中分离无意义文本的算法

我为我的一些程序提供了反馈功能.不幸的是,我忘了包含某种垃圾邮件保护 - 所以用户可以将他们想要的任何内容发送到我的服务器 - 每个反馈都存储在一个巨大的数据库中.

一开始我定期检查这些反馈 - 我过滤掉了可用的和删除的垃圾.问题是:我每天收到900条反馈.只有4-5个真正有用,其他消息大多是2种类型的乱码:

  • 废话:jfvgasdjkfahs kdlfjhasdf(人们在键盘上粉碎他们的头脑)
  • 语言我不明白

到目前为止我做了什么:

  1. 我安装了一个过滤器来删除任何包含"asdf","qwer"等的反馈...... - >每天只有700个

  2. 我安装了一个文字过滤器来删除任何包含不良语言的东西 - >每天600(不要问 - 但那里有很多奇怪的人)

  3. 我过滤掉任何包含我的语言未使用的字母的消息 - >每天400

但每天400仍然太多了.所以我想知道是否有人之前已经处理过这样的问题并且知道某种算法来过滤掉无意义的消息.

真的很感激任何帮助!

algorithm nlp filter cpu-word spam

8
推荐指数
5
解决办法
2913
查看次数

为什么我要说服开发人员使用端口587进行所有SMTP通信?

将端口587用于所有客户端到MTA通信的趋势越来越明显.它位于标准跟踪RFC:http://www.ietf.org/rfc/rfc2476.txt

我的问题是"为什么?".为什么有两个SMTP服务器实例在同一台服务器上运行,如果它们都做同样的事情?它提供了什么安全功能,除了给我两个作为管理员进行故障排除的事情.

这似乎是不必要的复杂性,除非ISP阻止端口25,否则不需要.即使这样,如果ISP阻止端口25以防止垃圾邮件,它只是意味着它只需要更多的时间,直到端口587也被阻止,我们将不得不完全使用不同的端口.

看起来我们正在为自己创造更多的工作,而不是解决问题并开始验证SMTP

pop3 exchange-server smtp rfc spam

8
推荐指数
2
解决办法
3705
查看次数

SPF for subdomain可以避免电子邮件垃圾邮件

SPF是一种避免将电子邮件阻止为垃圾邮件的强大方法.但是,SPF的设置通常用于主域,我无法找到子域的设置,我不确定它是否有效.我想mail.domain.com在单独的服务器上设置我的电子邮件服务器.主域的SPF是

@                 v=spf1 mx include:domain.com ~all
@                 v=spf1 a mx ptr ip4:0.0.0.0 ~all
Run Code Online (Sandbox Code Playgroud)

对于邮件服务器(子域)

mail.domain.com   v=spf1 mx include:mail.domain.com ~all
mail.domain.com   v=spf1 a mx ptr ip4:1.1.1.1 ~all
Run Code Online (Sandbox Code Playgroud)

其中0.0.0.0是主服务器IP,1.1.1.1是邮件服务器IP.此设置是否可以成功使用mail.domain.com进行电子邮件(例如name@mail.domain.com)?

还有哪些其他注意事项可以帮助避免将从子域发送的电子邮件标记为垃圾邮件?

email dns spf email-spam spam

8
推荐指数
1
解决办法
2万
查看次数

PermError SPF永久错误:DNS查找太多

我配置了SPF和TXT记录.当我检查SPF记录语法时.它说PermError SPF永久错误:DNS查找太多.

 v=spf1 include:_spf.google.com include:netcore.co.in ~all 
Run Code Online (Sandbox Code Playgroud)

我的电子邮件也在垃圾邮件中登陆.

1)我在共享主机上,我没有配置专用的IP和DKIM.实际上我不发送垃圾邮件触发单词的电子邮件.因为我在共享主机上.共享主机上是否有其他可能发送电子邮件导致我的电子邮件在垃圾邮件中登陆.

2)我使用netcore.co.in发送群发邮件.和google.com从gmail发送邮件.我也正确配置了MX记录.我已经提到谷歌MX记录但不是netcore.net MX记录.我正在使用sendgrid的免费smtp服务器从我的java网络应用程序发送电子邮件.我没有在spf记录中提到过.SPF记录是否导致垃圾邮件问题.

email gmail spf spam sendgrid

8
推荐指数
1
解决办法
2万
查看次数

是否可以解码邮件头中的SPAMCAUSE字段?

我想解码这个字符串:X-OVH-SPAMCAUSE:gggruggvucftvghtrhhoucdtuddrfeelgedrvdduucetufdoteggodetrfdotffvucfrrhhofhhilhgvmecuqfggjfenuceurghilhhouhhtmecufedttdenucgohfhorhgsihguuggvnhfjughrucdlhedttddm

有人可以做一个工具或者什么吗?

谢谢.

email decode spam email-headers

8
推荐指数
2
解决办法
1425
查看次数

如何检查链接/网址的垃圾邮件

我知道大多数垃圾邮件都与一个或多个链接有关,所以我想知道是否有任何Web服务可以检查URL的垃圾邮件权重/垃圾邮件.与Akismet如何检查文本内容的垃圾内容类似.

ps - 我在谷歌搜索,找不到任何令人满意的:)

api web-services spam-prevention spam

7
推荐指数
1
解决办法
268
查看次数

防止垃圾邮件; 使用Nodemailer; 使用Sendmail

我正在使用Nodemailer Node.js模块与sendmail连接.但是,当我通过Gmail帐户访问时,我的电子邮件会直接转到垃圾邮件文件夹.为什么我的电子邮件是狗屎?它必须与电子邮件的标题有关,但我不知道它可能是什么.

我对电子邮件和垃圾邮件过滤器的查找方式并不熟悉,所以有人可以向我提供一些需要注意的细节吗?

谢谢阅读.:)

sendmail spam node.js nodemailer

7
推荐指数
1
解决办法
4958
查看次数

在来自http或https的电子邮件中提供图片?

我是否在加密域中的电子邮件广告系列中提供图像会有所不同吗?这会使电子邮件不太可能最终进入客户端的垃圾邮件文件夹吗?

email spam-prevention email-spam spam email-attachments

7
推荐指数
2
解决办法
5720
查看次数

Hotmail消息中的X-Message-Delivery

最近我盯着解密hotmail收件箱/垃圾文件夹放置.经过长时间的搜索,我发现Hotmail/Outlook正在使用他们在每封邮件中输入的X-Message-Delivery标签来确定很多东西.如果您转到电子邮件来源,您可以看到类似于此的X-Message-Delivery:

Vj0xLjE7dXM9MDtsPTE7YT0wO0Q9MjtHRD0yO1NDTD00

如果你BASE64解码它你得到

V=1.1;us=0;l=1;a=0;D=2;GD=2;SCL=4

根据我的研究,我发现以下事情导致邮件进入垃圾文件夹,

If "D=x" is higher then 1
If "GD=x" is higher then 1
If "SCL=x" is higher then 0
Run Code Online (Sandbox Code Playgroud)

除此之外,我发现V = 1.1总是相同的,并且在我收到的任何电子邮件中都没有变化(或至少我检查的那些)

我认为"a = x"意味着如果发送者在接收者地址簿中,或者接收者至少知道.如果它的0是一个新的发送者,因此更有可能进入垃圾文件夹,如果它的a = 1,它有助于进入收件箱.

我认为l = 1或l = 0有一些东西可以使用,如果图像在打开时被阻止或不被这个发送者阻止.虽然我没有发现这一点非常一致.

你们有谁知道,这些标签代表什么?

D=
GD=
us= 
Run Code Online (Sandbox Code Playgroud)

如果你这样做,你也知道它们会从0变为1或2吗?

感谢你!

spam-prevention email-spam spam hotmail

7
推荐指数
1
解决办法
4105
查看次数

获取spamassassin以删除包含附加文件名中特定REGEX的电子邮件

新手问第一个问题:)

我正在使用SpamAssassin运行邮件服务器(Ubuntu/Postfix/Dovecot).大多数已知的垃圾邮件被标记(RBL,显而易见的UCE),除了这个特定的malspam附加的zip文件,如"order_info_654321.zip","paymet_document_123456.zip"等,当它不适合任何其他SA规则.我想购买一条规则,将匹配的违法者放入遗忘状态.

在摆弄regex101.com之后,我想出了一个与这些模式完全匹配的表达式:

/\w+[_][0-9]{6}.zip$/img

问题是......如何格式化它,让它工作,以及放在哪里?到目前为止,我编辑了/etc/spamassassin/local.cf,将其添加到底部,并重新启动:

mimeheader TROJAN_ATTACHED Content-Type =~ /\w+[_][0-9]{6}.zip$/img
describe ZIP_ATTACHED email contains a zip trojan attachment
score TROJAN_ATTACHED 99.
Run Code Online (Sandbox Code Playgroud)

但它似乎没有做出魔力.我还能在哪里找到这个?

谢谢大家,Keijo.-

regex spamassassin spam

7
推荐指数
1
解决办法
4034
查看次数