dro*_*ren 5 html java android html-parsing jsoup
我正在使用一个名为Jsoup的HTML解析器来加载和解析HTML文件.问题是我正在抓取的网页是在ISO-8859-1字符集中进行编码,而Android正在使用UTF-8编码(?).这导致一些字符显示为问号.
所以现在我想我应该将字符串转换为UTF-8格式.
现在我在Android SDK中发现了这个名为CharsetEncoder的类,我想这可以帮助我.但我无法弄清楚如何在实践中实现它,所以我想知道是否可以通过一个实际的例子得到som的帮助.
更新:读取数据的代码(Jsoup)
url = new URL("http://www.example.com");
Document doc = Jsoup.parse(url, 4000);
Run Code Online (Sandbox Code Playgroud)