Pra*_*een -1 java regex android
我有这个标签作为输入标签:
<a href="controller.jsp?sid=127490C88DB5&R=35144" class="11-link-dkred-bold"><b>Mr. John Q. Anderson MBA 1977 E</a>
Run Code Online (Sandbox Code Playgroud)
在这我想要得到的价值
John Q. Anderson先生MBA 1977 E.
wat是正则表达式中的patten价值吗?
这是一个非常糟糕的主意TM使用正则表达式,因为它不是一个正规的语言来解析HTML.最好通过整理(清理它),然后使用XML解析器或使用XPath来运行它.
否则,匹配模式与捕获是:
<.*?>\([^<]+\)</.*?>
Run Code Online (Sandbox Code Playgroud)
编辑
我刚注意到你的HTML格式不正确!您没有结束</b>标记.我给你的正则表达式只有在你用一个标记包装文本时才有效.它不适用于您的示例.假设你总是有一个<b>...</b>标签,你可以这样做:
<.*?><b>\([^<]+\)</b></.*?>
Run Code Online (Sandbox Code Playgroud)