我最近尝试登录网站,迫使我接受cookie.我正在使用phantomJs和casperJs.我写了一个应该处理登录的小脚本,但它将我重定向到一个告诉我必须接受cookie的网站.电子邮件和密码只是占位符.
我想登录的网站是https://de.buyvip.com/.但是我需要点击按钮Anmelden mit Amazon才能登录我的亚马逊帐户.其他登录表单不起作用.(这导致这个长网址,我只是从我的浏览器复制它)
有人能帮我吗?
这是脚本:
var casper = require("casper").create()
var fs = require('fs');
var page = "https://www.amazon.de/ap/signin?openid.ns=http%3A%2F%2Fspecs.openid.net%2Fauth%2F2.0&pageId=quarterdeckde&openid.identity=http%3A%2F%2Fspecs.openid.net%2Fauth%2F2.0%2Fidentifier_select&clientContext=280-1158662-4507036&openid.claimed_id=http%3A%2F%2Fspecs.openid.net%2Fauth%2F2.0%2Fidentifier_select&openid.mode=checkid_setup&marketPlaceId=A38GABX06X24K&openid.assoc_handle=quarterdeckde&openid.return_to=https%3A%2F%2Fde.buyvip.com%2Fsignin&openid.pape.max_auth_age=0&siteState=http%3A%2F%2Fde.buyvip.com%2Fhomepage%3Fhash%3DM";
phantom.cookiesEnabled = true;
casper.start(page, function()
{
console.log("started");
this.fill('form#ap_signin_form', {
'email' : 'myMail',
'password' : 'myPass'
}, true);
});
casper.then(function()
{
fs.write("test.html", this.getHTML(), "w");
});
casper.run();
Run Code Online (Sandbox Code Playgroud) 现在我正在开发一个webcrawler.这个应该解析一些特定的站点,并给我一个输出到xml文件.到目前为止,这没问题.Crawler可以工作,您可以通过cfg文件快速自定义它.我使用Jsoup来解析HTML内容.
我刚刚添加了一些网站,并注意到我通过JavaScript创建的HTML内容存在巨大问题.难道没有办法让Jsoup支持Javascript吗?或者至少获取我在浏览器中可以看到的完整HTML内容.
我已经尝试过HtmlUnit,但是这个并不好.它没有给我我在浏览器中获得的内容.
诚恳,
Ogofo
我目前正在研究 hex->base64 转换器。我该如何处理奇数个十六进制数字?到目前为止,我所做的是每个十六进制数字都是一个 4 位数字,因此 2 个十六进制数字是 1 个字节。如果我遇到奇数个十六进制数字,我是否只需用 0 填充未完成字节的其余部分?还是我应该返回错误?