我正在尝试解析facebook的首页,JSoup
但我总是得到移动设备的HTML代码而不是普通浏览器的版本(在我的情况下是Firefox 5.0).
我正在设置我的用户代理:
doc = Jsoup.connect(url)
.userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:5.0) Gecko/20100101 Firefox/5.0")
.get();
Run Code Online (Sandbox Code Playgroud)
难道我做错了什么?
编辑:
我刚刚解析了http://whatsmyuseragent.com/,看起来用户代理正在运行.现在,为什么网站http://www.facebook.com/在使用JSoup和我的浏览器时会返回不同的版本,这让我更加困惑.两者都使用相同的用户....
我现在也注意到了其他一些网站上的这种行为.如果你能向我解释问题是什么,我会非常高兴.
我正在尝试使用JSoup来填充URL,其中包含以下文本:Ætterni
.解析文档后,相同的字符串如下所示:Ætterni
.
如何防止这种形式发生?我希望文档1:1与它完全一样.
码:
doc = Jsoup.connect(url).get();
String docEncoding=doc.outputSettings().charset().name();
OutputStreamWriter writer = new OutputStreamWriter(new FileOutputStream(localLink),docEncoding);
writer.write(doc.html());
writer.close();
Run Code Online (Sandbox Code Playgroud)