use*_*ser 6 html java regex decode
我需要title从html文件中提取段落(如StackOverflow).
我可以在Java中使用正则表达式来提取我需要的字段,但我必须decode获得所获得的字段.
例
字段提取:
Paging Lucene's search results (with **;** among **'** and **s**)
Run Code Online (Sandbox Code Playgroud)
解码后的字段:
Paging Lucene's search results
Run Code Online (Sandbox Code Playgroud)
java中是否有允许我转换这些html代码的类?
jlo*_*rdo 26
使用Apache Commons Lang提供的方法
import org.apache.commons.lang.StringEscapeUtils;
// ...
String afterDecoding = StringEscapeUtils.unescapeHtml(beforeDecoding);
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
38109 次 |
| 最近记录: |