使用Jsoup从网页中提取语言

Edo*_*ili 2 java jsoup

例如我有

<html lang="en"> ...... web page </html>

我想用Jsoup提取字符串“ en”。

我尝试使用选择器和属性没有成功。

Document htmlDoc = Jsoup.parse(html);
Element taglang = htmlDoc.select("html").first();
System.out.println(taglang.text());
Run Code Online (Sandbox Code Playgroud)

Psh*_*emo 5

看起来您想获取lang attribute的值。在这种情况下,你可以使用attr("nameOfAttribute")

System.out.println(taglang.attr("lang"));
Run Code Online (Sandbox Code Playgroud)