小编Tun*_*soy的帖子

为什么HTMLunit不能在这个https网页上运行?

我正在尝试更多地了解HTMLunit并进行一些测试.我正在尝试从此站点获取页面标题和文本等基本信息:

https://....com(删除了完整的网址,重要的是它是https)

我使用的代码就是这个,在其他网站上运行正常:

 final WebClient webClient = new WebClient();
  final HtmlPage page;
  page = (HtmlPage)webClient.getPage("https://medeczane.sgk.gov.tr/eczane/login.jsp");
  System.out.println(page.getTitleText());
  System.out.println(page.asText());
Run Code Online (Sandbox Code Playgroud)

为什么我不能获得这些基本信息?如果是因为安全措施,具体是什么,我可以绕过它们吗?谢谢.

编辑:嗯,代码在webclient.getpage()之后停止工作; ,test2没有写.所以我无法检查页面是否为空.

  final WebClient webClient = new WebClient(BrowserVersion.FIREFOX_2);
  final HtmlPage page;
  System.out.println("test1");
    try {
        page = (HtmlPage)webClient.getPage("https://medeczane.sgk.gov.tr/eczane/login.jsp");
      System.out.println("test2");
Run Code Online (Sandbox Code Playgroud)

java security screen-scraping htmlunit

4
推荐指数
1
解决办法
8300
查看次数

如何编写可以在网页上浏览和操作的自动化机器人

我需要编写一个需要执行以下操作的机器人:

转到jsp页面并按以下方式搜索:

  • 1:在搜索框上写点东西
  • 2:点击搜索按钮(提交按钮)
  • 3:单击生成的按钮/链接之一(具有不同输出的相同jsp页面)
  • 4:获取新页面的整个html(具有不同输出的相同jsp页面)

第四个可以用屏幕抓取完成,我认为我不需要它的帮助.但我需要一些指导,从1到3做选项.任何链接或只是一些关键字,将帮助我谷歌了解它将不胜感激.我打算用java做这个.

java screen-scraping bots

2
推荐指数
2
解决办法
4万
查看次数

如何使用javascript/jquery动态设置此eway脚本的data-amount属性?

如何使用js/jquery动态更改以下脚本的数据量?

     <script src="https://secure.ewaypayments.com/scripts/eCrypt.js"
           class="eway-paynow-button"               
           data-publicapikey="epk-4CE77D3C-FEE1-4FA5-98C9-7B67D22198EC"
           data-amount="0"
           data-currency="AUD" >
        </script>
Run Code Online (Sandbox Code Playgroud)

javascript jquery payment-gateway

1
推荐指数
1
解决办法
486
查看次数