我知道如何阅读网站的html代码,例如,下一个java代码读取所有html代码, http://www.transfermarkt.co.uk/en/fc-barcelona/startseite/verein_131.html 这是一个显示FC Barcelona所有足球运动员的网站.
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.URL;
public class ReadWebPage {
public static void main(String[] args) throws IOException {
String urltext = "http://www.transfermarkt.co.uk/en/fc-barcelona/startseite/verein_131.html";
URL url = new URL(urltext);
BufferedReader in = new BufferedReader(new InputStreamReader(url
.openStream()));
String inputLine;
while ((inputLine = in.readLine()) != null) {
// Process each line.
System.out.println(inputLine);
}
in.close();
}
}
Run Code Online (Sandbox Code Playgroud)
好的,但现在我需要使用HTML代码,我需要获取名称("Valdés,Victor","Pinto,JoséManuel"等等)和位置(守门员,防守,中场,前锋)每个队员的球员.例如,我需要创建一个ArrayList <String> PlayerNames和a ArrayList <String> PlayerPositions并将所有玩家的所有名称和位置放在这些数组上.
我怎么能这样做?我找不到可以在google上执行此操作的代码示例 ..... 欢迎使用代码示例
谢谢
我建议使用HtmlUnit,它可以让你访问HTML页面的DOM树,甚至可以在使用AJAX将数据动态放入页面的情况下执行JavaScript.
你也可以使用JSoup:没有JavaScript,但更轻量级并支持CSS选择器.