如何通过Java程序阅读网页内容?

tem*_*elm 1 java web-scraping

我打算编写一个Java程序来从网站(http://www.doviz.com)读取一些汇率,并想知道什么是最好的方法只能阅读(或阅读整个和剥离所需的部分)我需要的内容.

任何帮助表示赞赏.

Jul*_*ont 6

我的建议是使用Jsoup

使用类似css/jquery的语法解析外部内容非常容易

// Only one line to parse an external content
Document doc = Jsoup.connect("http://jsoup.org").get();

// "Javascript-like" syntax
Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}

// "Jquery/Css-like" syntax
Elements resultLinks = doc.select("h3.r > a");
Elements pngs = doc.select("img[src$=.png]");
Run Code Online (Sandbox Code Playgroud)

只需将jsoup.jar库添加到类路径中即可享受!
开源和免费使用当然.