更有效地编写HTTP脚本

Zom*_*ies 8 ruby python scripting perl http

通常我想自动化http查询.我目前使用Java(和commons http客户端),但可能更喜欢基于脚本的方法.一些非常快速和简单的东西.我可以在哪里设置标题,转到页面而不用担心设置整个OO生命周期,设置每个标题,调用html解析器...我正在寻找任何语言的解决方案,更喜欢脚本

Mechanize for Python似乎很容易使用:http://wwwsearch.sourceforge.net/mechanize/

它似乎也存在于perl中. (2认同)

看看Selenium.如果您需要自定义脚本,它会为C#,Java,Perl,PHP,Python和Ruby生成代码.

Watir听起来接近你想要的,虽然它(如Selenium在另一个答案中链接)实际上打开了一个浏览器来做东西.你可以在这里看到一些例子.另一种基于浏览器的记录+回放方法系统是sahi.

如果您的应用程序使用WSGI,那么粘贴是一个不错的选择.

在另一个答案中链接的Mechanize是"库中的浏览器",perl,Ruby和Python中都有克隆.Perl one是原始的,如果你不想要浏览器,这似乎是要走的路.这种方法的问题是所有前端代码(可能依赖于JavaScript)都不会被执行.

轮到我了:ww或perl with lwp.您将在链接页面上找到示例.

如果你有简单的需求(获取页面然后解析它),那么很难击败LWP :: Simple和HTML :: TreeBuilder.

use strict;
use warnings;

use LWP::Simple;
use HTML::TreeBuilder;

my $url = 'http://www.example.com';
my $content = get( $url) or die "Couldn't get $url";

my $t = HTML::TreeBuilder->new_from_content( $content );
$t->eof;
$t->elementify;

# Get first match:
my $thing = $t->look_down( _tag => 'p', id => qr/match_this_regex/ );

print $thing ? $thing->as_text : "No match found\n";

# Get all matches:
my @things = $t->look_down( _tag => 'p', id => qr/match_this_regex/ );

print $_ ? $_->as_text : "No match found" for @things;

Run Code Online (Sandbox Code Playgroud)

归档时间：	15 年，11 月前
查看次数：	4339 次
最近记录：	15 年，11 月前

python中的负零 47

attr_reader名称中带有问号 29

Ruby:如何检查字符串是否包含多个项目？ 18

Ruby如何在语义上处理赋值？ 13

关于关系belongs_to的activerecord where子句 12

缓存控制:'private'使'no-cache ="set-cookie"'不必要？ 11

Ruby 2.7.4 和 3.0.0 在 macOS Big Sur (11.2.3) 上失败：未声明的标识符 RSA_SSLV23_PADDING 11

不同书写系统之间的音译 5

如何使用与主脚本相同的文件中定义的Moose类？ 4

如何在PHP中禁用卷曲调试输出 1

在JavaScript中深度克隆对象的最有效方法是什么？ 5181

如何将空目录添加到Git存储库？ 4039

停止EditText在Activity启动时获得焦点 2770

如何在Python中延迟时间？ 2638

如何让Git忽略文件模式(chmod)的变化？ 2188

传输安全性阻止了明文HTTP 1425

静态只读与const 1349

为什么不从List <T>继承？ 1299

如何删除文本/输入框周围的边框(轮廓)？(铬) 1208

如何从Python字符串中修剪空格？ 1103