出于完全非恶意的目的-特别是机器学习,我想下载一个庞大的CAPTCHA图像数据集。但是,始终使用一些混淆的javascript来实现CAPTCHA,这使得在没有浏览器的情况下获取实际图像成为一项艰巨的任务,至少对我(这是javascript新手)而言。
因此,任何人都可以给我一些有用的指导,以指示如何使用完全在浏览器外部的脚本来下载模糊单词的图像吗?并且请不要将我指向已经收集到的模糊单词的数据集-我需要为此特定实验从特定网站收集图像。
谢谢!
编辑:可以问这个问题的另一种方法很简单。当您在带有复杂javascript的网站上单击“查看源代码”时,您会看到脚本引用,但仅此而已。但是,如果单击“将网页另存为...”(在firefox中),然后查看已保存网页的源,则将解析javascript,并且新的html和图像(至少在ASIRRA和reCAPTCHA的情况下)为在源中。如何使用脚本模仿这种“将网页另存为...”的行为?一般而言,这是一个重要的Web编码问题,因此请不要再以此动机向我提出疑问!从现在开始,这是我可以在涉及脚本的所有Web开发中使用的知识,并且我相信其他堆栈溢出访问者也可以使用!
如果我正在处理一个类和一个公共结构(不是嵌套的),我应该为结构创建一个单独的.cs吗?或者将它嵌套在类的.cs文件中?(这假设结构与类有关,但对于类应该嵌套并声明为私有并不是如此独占)
如果你没有释放你在Linux下的C程序中使用malloc的内存,它什么时候发布?程序终止后?或者内存是否仍然被锁定,直到一个不可预见的时间(可能在重新启动时)?
我有课而不是让背景工作者做一些处理器密集型的东西.后台工作者读取一些全局声明的字符串...我是否需要锁定这些字符串?backgroundworker从不编写字符串,它们只是表示在类的构造函数中设置的一些目录位置,并且几乎不会在构造函数之后由类写入(并且永远不会被后台工作者写入).所以这是可能的后台工作能读,因为它也正在由主类对象写入,但不可思议的事的字符串.但是,这些操作(后台工作者的读取和主类的写入)对于字符串文字都不是原子的吗?
谢谢,-Robert
编辑:我不关心字符串是否过时或任何事情(这在我的应用程序中不会是一个大问题),我更担心的是"对象在其他地方使用"异常.
我有一个ASP.NET MVC 4项目,它在Web.config中使用Windows身份验证,如下所示:
<system.web>
<authentication mode="Windows" />
</system.web>
Run Code Online (Sandbox Code Playgroud)
但是,如果我ServiceSecurityContext.Current从Controller方法调查,它是null.它不应该包含用户的身份验证信息,因为我使用的是Windows身份验证吗?
我试图解决这个问题的原因是因为我想知道CredentialCache.DefaultNetworkCredentialsController方法使用的凭据.通过阅读有关该属性的MSDN文章我收集的内容,它使用当前安全上下文的凭据...为null.
谢谢您的帮助!