可能重复:RegEx匹配HTML标记并提取文本
我需要在html标签之间得到文本<p></p>或者其他什么.我的模式就是这个
Pattern pText = Pattern.compile(">([^>|^<]*?)<");
Run Code Online (Sandbox Code Playgroud)
任何人都知道一些更好的模式,因为这个不是很有用.我需要它来索引来自网页的内容.
谢谢
| 归档时间: |
|
| 查看次数: |
2400 次 |
| 最近记录: |