小编Mar*_*kus的帖子

JSoup UserAgent,如何设置正确?

我正在尝试解析facebook的首页,JSoup但我总是得到移动设备的HTML代码而不是普通浏览器的版本(在我的情况下是Firefox 5.0).

我正在设置我的用户代理:

doc = Jsoup.connect(url)
      .userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:5.0) Gecko/20100101 Firefox/5.0")
      .get();
Run Code Online (Sandbox Code Playgroud)

难道我做错了什么?

编辑:

我刚刚解析了http://whatsmyuseragent.com/,看起来用户代理正在运行.现在,为什么网站http://www.facebook.com/在使用JSoup和我的浏览器时会返回不同的版本,这让我更加困惑.两者都使用相同的用户....

我现在也注意到了其他一些网站上的这种行为.如果你能向我解释问题是什么,我会非常高兴.

jsoup

36
推荐指数
3
解决办法
5万
查看次数

阻止Jsoup编码

我正在尝试使用JSoup来填充URL,其中包含以下文本:Ætterni.解析文档后,相同的字符串如下所示:Ætterni.

如何防止这种形式发生?我希望文档1:1与它完全一样.

码:

doc = Jsoup.connect(url).get();
String docEncoding=doc.outputSettings().charset().name();
OutputStreamWriter writer = new OutputStreamWriter(new FileOutputStream(localLink),docEncoding);
writer.write(doc.html());
writer.close();
Run Code Online (Sandbox Code Playgroud)

java jsoup

3
推荐指数
1
解决办法
3184
查看次数

标签 统计

jsoup ×2

java ×1