什么是java或android中的html标签的正则表达式模式?

Pra*_*een -1 java regex android

我有这个标签作为输入标签:

<a href="controller.jsp?sid=127490C88DB5&R=35144" class="11-link-dkred-bold"><b>Mr. John Q. Anderson&nbsp;&nbsp;&nbsp;MBA 1977 E</a>
Run Code Online (Sandbox Code Playgroud)

在这我想要得到的价值

John Q. Anderson先生MBA 1977 E.

wat是正则表达式中的patten价值吗?

Viv*_*ath 8

这是一个非常糟糕的主意TM使用正则表达式,因为它不是一个正规的语言来解析HTML.最好通过整理(清理它),然后使用XML解析器或使用XPath来运行它.

否则,匹配模式与捕获是:

<.*?>\([^<]+\)</.*?>
Run Code Online (Sandbox Code Playgroud)

编辑

我刚注意到你的HTML格式不正确!您没有结束</b>标记.我给你的正则表达式只有在你用一个标记包装文本时才有效.它不适用于您的示例.假设你总是有一个<b>...</b>标签,你可以这样做:

<.*?><b>\([^<]+\)</b></.*?>
Run Code Online (Sandbox Code Playgroud)