据我所知,Captchas 是被过滤器、噪声和其他杂项算法的应用扭曲的文本。因此,要确定一个人的阅读能力是否与一个人的阅读能力相同,您可以将他们回答的内容与已知的答案进行比较。
现在,阅读 ReCaptcha,它说显示的单词是 OCR 无法翻译的单词。此外,recaptcha 被用于翻译这些图像。它如何判断您的阅读确实是正确的还是只是在胡编乱造?
如果它知道它说了什么,它就不会在 recaptcha 中用作翻译材料。如果它不知道文本说什么,那么它如何验证您的答案?
我猜这可能是一些基于概率的分析,样本量很大,然后才将任何内容标记为已翻译。
有谁知道这个问题的答案在哪里?
据我所知,谷歌已将其重新验证码更改为适用于 google chrome 浏览器的新验证码。Google URL Shortener使用这种验证码。
此重新验证码只需单击一下即可自动验证“我们不是机器人”。但它是如何工作的?
在下图中,您可以看到验证码。
(1) 我们点击“我不是机器人”,(2) 过了一会儿,(3) 重新验证码会自动验证:

我希望 reCAPTCHA 在我访问的所有网站(例如注册页面等)上以英语显示,但它是波斯语的。像这样:

我尝试更改帐户设置中的语言来刷新它、清除cookie、历史记录等,但没有任何效果。
如何将 reCAPTCHA 使用的语言更改为英语?
更新
我在 IE 和 Edge 浏览器上进行了测试,reCAPTCHA 在这些浏览器中是英文的。只是在铬合金中它仍然是波斯语。有什么建议可以在 Chrome 上将其设置为英文吗?
因此,reCAPTCHA 面临着其中一项挑战,即您必须单击图像,然后新图像淡入以替换它们。为什么图像有时会如此缓慢地淡出/淡入?有时它几乎是即时的,有时有点缓慢,有时非常缓慢。
我经常遇到 reCAPTCHA,在单击前一个图像后,新图像需要整整 5 秒才能完全淡入。
这与整个系统的不可靠程度相结合,有时会导致它需要几分钟的时间才能通过它们。
为什么这么慢?这是预期的行为还是某种错误?
我不认为这是浏览器问题,但如果重要的话,我主要使用 Firefox。虽然我似乎记得在 Chrome 上也遇到过同样的问题。
我正在使用 VPN,我认为这是我一开始经常收到 reCAPTCHA 的主要原因。
它是图形,因此需要大多数机器人(显然)缺乏的笨重 OCR?即便如此,它是一个固定的图形,并不真正需要 OCR 只是针对一个项目的库进行简单的模式匹配。我只是不明白它是如何构成阻碍机器人的不可逾越的障碍。
我只是出于好奇而问。
今天我在被 RECAPTCHA 捕获时遇到了几个非常奇怪的词:
如果这些在任何语言中都是合理的词,那么谷歌搜索应该会产生一些在句子中使用这些词的合理页面。但是,上述单词的 Google 搜索结果数量为 3、0、27 和 0。对于其他合理的单词,这些命中显然是不可能的错别字。
那么 RECAPTCHA 从哪里得到这些词呢?(注意:“书籍”不是一个足够的答案:) 我正在寻找对看似不存在的词的高发生率的解释......)