建议使用honeypot img标签来检测刮刀/坏机器人

ano*_*one 5 html image detect scraper honeypot

我们想在我们的html体中设置一个小蜜罐图像来检测刮刀/坏机器人.

有没有人之前设置过这样的东西?

我们认为最好的方法是:

a)通过以下方式评论html:

<!-- <img src="http://www.domain.com/honeypot.gif"/> -->
Run Code Online (Sandbox Code Playgroud)

b)将css样式应用于图像,使其通过以下方式隐藏在浏览器中:

.... id="honeypot" ....

#honeypot{
    display:none;
    visibility:hidden;
}
Run Code Online (Sandbox Code Playgroud)

使用上面的任何人都可以预见任何适当和真实的使用者会拉动图像/尝试渲染它的情况吗?

honeypot.gif将是一个mod_rewritten php脚本,我们将在其中进行日志记录.

虽然我知道任何编码良好的刮刀都可以跳过上述2个条件,但至少会对非常脏的刮刀有所了解.

关于最佳方式的任何其他指示?

mah*_*mah 3

机器人会忽略您的 img 标签,因为它位于评论内。

相反,您可以考虑创建一个不可见的 div,其中包含指向同一站点上的触发器 URL 的链接(最好在同一目录中,以防机器人对深度敏感)。