如何使用Java上的html代码?

Nul*_*ion -11 html java

我知道如何阅读网站的html代码,例如,下一个java代码读取所有html代码, http://www.transfermarkt.co.uk/en/fc-barcelona/startseite/verein_131.html 这是一个显示FC Barcelona所有足球运动员的网站.

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.URL;

public class ReadWebPage {
    public static void main(String[] args) throws IOException {
        String urltext = "http://www.transfermarkt.co.uk/en/fc-barcelona/startseite/verein_131.html";
        URL url = new URL(urltext);
        BufferedReader in = new BufferedReader(new InputStreamReader(url
                .openStream()));
        String inputLine;

        while ((inputLine = in.readLine()) != null) {
            // Process each line.
            System.out.println(inputLine);
        }
        in.close();
    }
}
Run Code Online (Sandbox Code Playgroud)

好的,但现在我需要使用HTML代码,我需要获取名称("Valdés,Victor","Pinto,JoséManuel"等等)和位置(守门员,防守,中场,前锋)每个队员的球员.例如,我需要创建一个ArrayList <String> PlayerNames和a ArrayList <String> PlayerPositions并将所有玩家的所有名称和位置放在这些数组上.

我怎么能这样做?我找不到可以在google上执行此操作的代码示例 ..... 欢迎使用代码示例

谢谢

JB *_*zet 9

我建议使用HtmlUnit,它可以让你访问HTML页面的DOM树,甚至可以在使用AJAX将数据动态放入页面的情况下执行JavaScript.

你也可以使用JSoup:没有JavaScript,但更轻量级并支持CSS选择器.

  • @AndroidUser99:回到学校学习礼貌和阅读.只有一个元素具有**ID**spieler.如在<table id ="spieler">如果您对HTML一无所知,并且不尊重免费帮助您的人,您将永远无法做任何事情.如果你想要一些免费的代码而不试图理解和学习,那就雇用一个开发人员.我的费用是每天600欧元. (6认同)
  • 很棒的答案 - JSoup很棒.OP太糟糕了,只想剪切和粘贴. (6认同)
  • 它应该不难.仔细检查HTML源代码:包含播放器的表具有ID"spieler".你只需要做一个getElementById("spieler")来获取这个表.使用JSoup,document.select("#spieler td.s10 a")应返回包含播放器名称的所有<a>元素.只需一行代码. (2认同)
  • 提出另一个问题,展示你尝试过的东西并解释你不理解的东西. (2认同)