使用JAVA从HTML标记中撕下subString

Ass*_*saf 1 html java tags string

假设我有一个像这样的字符串" neverMind<b>What is up</b>neverMind",我想用JAVA取出使用正则表达式的内容.有人告诉我,使用匹配器将是最好的.谁能告诉我如何使用Matcher做到这一点?
其他解决方案也欢迎!谢谢!

tan*_*ens 5

如果你的字符串一直很简单,你可以使用java Pattern.但是如果你的字符串变得更复杂并且想要从嵌套结构中提取内容,那么你应该使用HTML解析器.

要选择正确的解析器,请查看以下问题:哪种HTML解析器最好.

如果您使用模式,您的正则表达式将如下所示:

Pattern pattern = Pattern.compile( "<b>(.*?)</b>" );
Matcher m = pattern.matcher( "neverMind<b>What is up</b>neverMind" );
if( m.find() ) {
    String theStringYouAreLookingFor = m.group( 1 );
}
Run Code Online (Sandbox Code Playgroud)