我正在使用Jsoup.parse()的所有String版本:
parse(String html, String baseUri)
Run Code Online (Sandbox Code Playgroud)
排除连接速度以对其性能进行基准测试.
在一个典型的低端Android手机,呼吁Jsoup.parse()在一个不那么罕见的长维基百科页面(〜600KB)的HTML字符串,需要9秒!
我的客户不愿意接受这种延迟,我想要将Jsoup转储到不同的引擎,自己解析网页(仍然使用Java),或者在NDK中使用一些C/C++解析器(如果可用).
但我更喜欢继续尽可能多地使用Jsoup.
有没有办法加快Jsoup.parse()?
我尝试用大页面做的事情(如果有可能,你只想在页面上找到一些信息)是尝试最小化文本以解析以前识别你想要的区域,然后用JSoup解析想要的区域.
这样你就可以在Java中结合自己的解析来减少数据,然后将JSoup用于商品.
| 归档时间: |
|
| 查看次数: |
3027 次 |
| 最近记录: |