好的,这就是我需要的.我有一个基于PHP的网络爬虫.它可以在这里访问:http: //rz7ocnxxu7ka6ncv.onion/ 现在,我的问题是我的蜘蛛实际抓取页面需要在SOCKS端口9050上这样做.事情是,我必须通过Tor隧道连接它以便它可以解析.onion域名,这就是我正在索引的内容.(仅以.onion结尾.)我使用php crawl.php从命令行调用此脚本,并添加适当的参数来抓取页面.这就是我的想法:有没有办法强迫它使用Tor?或者我可以强迫我的整个机器通过Tor隧道,以及如何?(就像强制所有流量通过127.0.0.1:9050)也许如果我设置全局代理设置,php会尊重它们吗?
如果我的任何解决方案有效,我该怎么做?(请一步一步说明,我是菜鸟.)
我只想创建自己的Tor搜索引擎.(不要推荐我的p2p搜索引擎 - 这不是我想要的 - 我知道它们存在,我完成了我的作业.)如果你有兴趣看看,这里是爬虫来源:也许有心的人可以修改它以使用127.0.0.1:9050进行所有抓取请求? http://pastebin.com/kscGJCc5