我正在尝试编写我的第一个Perl程序.如果您认为Perl对于手头的任务来说是一种糟糕的语言,请告诉我哪种语言可以更好地解决它.
该程序测试给定机器和远程Apache服务器之间的连接.首先,程序从Apache服务器请求目录列表,而不是解析列表并逐个下载所有文件.如果文件出现问题(连接在达到指定的Content-Length之前重置),则应记录此信息并检索下一个文件.无需保存文件甚至检查完整性,我只需要记录完成所需的时间以及连接重置的所有情况.
要从Apache生成的目录索引中检索链接列表,我计划使用类似的regexp
/href=\"([^\"]+)\"/
Run Code Online (Sandbox Code Playgroud)
实际上,regexp尚未调试.
从Perl执行HTTP请求的"参考"方式是什么?我用Google搜索并找到了使用许多不同库的示例,其中一些是商业化的.我需要能够检测到断开连接(超时或TCP重置)并处理这些内容的东西.
另一个问题.当使用最少的编码工作全局搜索字符串列表时,如何存储我的正则表达式捕获的所有内容?
hob*_*bbs 10
就整个问题描述而言,我会使用WWW :: Mechanize.Mechanize是一个子类,LWP::UserAgent它添加了有状态行为和HTML解析.使用mech,您可以这样做$mech->get($url_of_index_page),然后使用$mech->find_all_links(criteria)选择要遵循的链接.
| 归档时间: |
|
| 查看次数: |
952 次 |
| 最近记录: |