为了一个卑鄙的目的打破CAPTCHAs

Dou*_*rel 12 captcha accessibility blind

要求用户阅读扭曲文本的CAPTCHA对于有视力的人来说是好的,但对于那些失明或有其他残疾的人来说是一个可怕的障碍.音频备选方案偶尔可用,但仍然无法帮助那些聋哑人和盲人,并且很难使用屏幕阅读器(已经在向您朗读文字).

存在一对夫妇使用人类解决代表用户,如的CAPTCHA解决方案的WebVisiumSolona,但这些依靠志愿者运营商的可用性(例如,Solona显然只有一个志愿,所以你必须希望他当你需要帮助时醒着).

在我看来,盲人所需的CAPTCHA解决方案的数量非常低 - 我猜想在像英国这样的人口稠密的国家每天不到几百个.这意味着,与想要在短时间内多次执行动作的坏人不同,为盲人提供的CAPTCHA援助服务可以承担相当大的计算资源 - 例如,亚马逊EC2中的计算机云- 来识别所呈现的文本.

我的问题是:假设你不太关心速度,并且你有很多可用的计算机,是否有算法可以让你解决今天常见的文本失真CAPTCHA,比如reCaptcha使用的那些?或者即使有大量的资源和时间,这些问题是否真的难以解决?

几点说明:

  1. 在这一点上,我的问题只是理论上的,但显然任何此类服务都必须谨慎控制访问以防止垃圾邮件发送者.也许只有注册的盲人才会被允许使用它.

  2. 我知道几年前使用一台算法在一台计算机上运行几秒钟就破坏旧的Yahoo CAPTCHA.我在问现代CAPTCHA是否可以打破,可能更慢,资源更多.

  3. 我知道会出现一些新的CAPTCHA类型,要求用户识别小猫定位图片.这些还没有普及,所以我现在只是询问文本失真.

Joe*_*oey 5

基本上解决文本失真验证码由三个单独的步骤组成:

  1. 找出有趣的部分在哪里
  2. 将文本分割成单独的字母
  3. 认识字母

剩下的唯一对计算机来说相当困难的问题是第二个问题。第一个通常并不难,除非您碰巧偶然发现了来自地狱的验证码。第三个问题由计算机解决,其成功率比人类高得多。

OCR 研究团队提供了一个有趣的网站,用于了解验证码如何被破解。