Java正则表达式:计算HTML文档中的单词/短语/通配符

rem*_*emo 0 html java regex

我有一种情况需要在HTML文档中找到单词/短语/通配符的出现次数.我认为最好的解决方案来自正则表达式.关于如何做到这一点的任何意见或想法.如果它的正则表达式可以指导我如何使用Java开始它.

dog*_*ane 5

我建议使用HTML Parser(例如jsoup)而不是正则表达式来执行此操作.