我正在尝试更多地了解HTMLunit并进行一些测试.我正在尝试从此站点获取页面标题和文本等基本信息:
https://....com(删除了完整的网址,重要的是它是https)
我使用的代码就是这个,在其他网站上运行正常:
final WebClient webClient = new WebClient();
final HtmlPage page;
page = (HtmlPage)webClient.getPage("https://medeczane.sgk.gov.tr/eczane/login.jsp");
System.out.println(page.getTitleText());
System.out.println(page.asText());
Run Code Online (Sandbox Code Playgroud)
为什么我不能获得这些基本信息?如果是因为安全措施,具体是什么,我可以绕过它们吗?谢谢.
编辑:嗯,代码在webclient.getpage()之后停止工作; ,test2没有写.所以我无法检查页面是否为空.
final WebClient webClient = new WebClient(BrowserVersion.FIREFOX_2);
final HtmlPage page;
System.out.println("test1");
try {
page = (HtmlPage)webClient.getPage("https://medeczane.sgk.gov.tr/eczane/login.jsp");
System.out.println("test2");
Run Code Online (Sandbox Code Playgroud) 我需要编写一个需要执行以下操作的机器人:
转到jsp页面并按以下方式搜索:
第四个可以用屏幕抓取完成,我认为我不需要它的帮助.但我需要一些指导,从1到3做选项.任何链接或只是一些关键字,将帮助我谷歌了解它将不胜感激.我打算用java做这个.
如何使用js/jquery动态更改以下脚本的数据量?
<script src="https://secure.ewaypayments.com/scripts/eCrypt.js"
class="eway-paynow-button"
data-publicapikey="epk-4CE77D3C-FEE1-4FA5-98C9-7B67D22198EC"
data-amount="0"
data-currency="AUD" >
</script>
Run Code Online (Sandbox Code Playgroud)