Android 中从 HTML 获取纯文本/从字符串中删除 HTML 标签

Nic*_*per 2 html string parsing android

我想在我的应用程序中的某处显示网站的一些内容。以下是它将获得的输入的示例:

<tr class='list even'><td class="list inline_header" colspan="6" >09e  Klasse 9e (Kla)</td></tr>
Run Code Online (Sandbox Code Playgroud)

它应该输出类似以下内容:

09e  Klasse 9e (Kla)
Run Code Online (Sandbox Code Playgroud)

我努力了

text.replaceAll("<*>", "");
Run Code Online (Sandbox Code Playgroud)

但它并没有按照我想要的方式工作。

我正在寻找这个问题的答案,但针对的是 Java/Android。

Al *_*hik 5

你可以尝试Html.fromHtml()代替replaceAll()

 String plainTextFromHTML = Html.fromHtml(TextsThatContainsHTML).toString();
Run Code Online (Sandbox Code Playgroud)

或者你可以同时利用两者Html.fromHtml() ,就像replaceAll()这样

String plainTextFromHTML = Html.fromHtml(TextsThatContainsHTML).toString().replaceAll("\n", "").trim();
Run Code Online (Sandbox Code Playgroud)