Ali*_*xel 8 php screen-scraping phpquery
我正在寻找一个PHP库,它允许我废弃网页并关注所有cookie并使用默认值预填充表单,这就是让我烦恼最多的东西.
我已经厌倦了必须将每个输入元素与xpath匹配,如果存在更好的东西,我会很高兴.我遇到过phpQuery,但手册不太清楚,我无法找到如何发出POST请求.
有人能帮我吗?谢谢.
@Jonathan Fingland:
在browserGet()手册提供的示例中,我们有:
require_once('phpQuery/phpQuery.php');
phpQuery::browserGet('http://google.com/', 'success1');
function success1($browser)
{
$browser->WebBrowser('success2')
->find('input[name=q]')->val('search phrase')
->parents('form')
->submit();
}
function success2($browser)
{
echo $browser;
}
Run Code Online (Sandbox Code Playgroud)
我想所有其他字段都被废弃并在GET请求中发回,我想用phpQuery :: browserPost()方法做同样的事情,但我不知道该怎么做.我试图刮的形式有一个输入令牌,我很乐意,如果phpQuery足够聪明,可以刮掉令牌,让我更改其他字段(在这种情况下是用户名和密码),通过POST提交一切.
PS:请放心,这不会用于垃圾邮件.
请参阅http://code.google.com/p/phpquery/wiki/Ajax,特别是:
phpQuery::post($url, $data, $callback, $type)
和
# data Object, String
它将数据参数定义为对象或字符串。POST 请求应该可以使用查询字符串格式,例如:
$data = "username=Jon&password=123456";
$url = "http://www.mysite.com/login.php";
phpQuery::post($url, $data, $callback, $type)
Run Code Online (Sandbox Code Playgroud)
由于 phpQuery 是一个 jQuery 端口,因此方法签名是相同的(文档直接链接到 jquery 站点 - http://docs.jquery.com/Ajax/jQuery.post)
编辑
两件事情:
还有一个phpQuery::browserPost
功能可能会更好地满足您的需求。
submit()
但是,还要注意 success2 回调仅在或click()
方法上调用,因此您可以在此之前填写所有表单字段。
例如
require_once('phpQuery/phpQuery.php');
phpQuery::browserGet('http://www.mysite.com/login.php', 'success1');
function success1($browser) {
$handle = $browser
->WebBrowser('success2');
$handle
->find('input[name=username]')
->val('Jon');
$handle
->find('input[name=password]')
->val('123456');
->parents('form')
->submit();
}
function success2($browser) {
print $browser;
}
Run Code Online (Sandbox Code Playgroud)
(请注意,这尚未经过测试,但应该有效)