如何提取HTML标签以获取特定信息？

Question

我需要从<title> </title>标签之间提取网页的标题.

还需要显示位于<body...>和</body>标签之间的所有文本,但身体外没有任何内容.

我不想要任何尖括号或任何返回的html数据.

Answer 1

您可以使用以下内容:

String html = "<html>My page</html>";
String title = html.substring(html.indexOf("<html>") + 6, html.indexOf("</html"));
System.out.println(title);

所述String.indexOf(字符串)方法返回一个字符串的起始索引(在本例中,"<html>"与"</html>"给定字符串(变量HTML)中).

所述String.substring(INT,INT)方法返回2个索引之间的字符串.

有了这个,您就可以启动浏览器了.