在Android应用中动态生成html

Question

我目前正在编写一个Android应用程序,除其他外,它使用我不拥有的网站的文本信息.此外,一些页面需要验证.

对于某些页面,我能够使用BasicNameValuePairs和带有关联对象的HTTPClient登录并检索html代码.

不幸的是,这些方法检索网页源而不运行浏览器(Android Webview甚至)通常运行的任何javascript函数.我需要其中一些脚本正在检索的文本.

我已经完成了我的研究,但我发现的一切都是猜测而且非常混乱.我可以忽略现在需要登录的页面.此外,我愿意发布任何可能对构建解决方案有用的代码; 这是一个独立的项目.

从javascript调用中抓取html结果的任何具体解决方案？一个例子绝对是一流的.

Answer 1

最终成功:

我试过的其他事情:

可能有效的事情:

将公布进一步的结果.如果发布,将添加其他结果.

注意:上面列出的许多选项互相引用.我认为rhino包含在sl4a和htmlunit中.另外,我认为htmlunit含有硒.

Answer 2

上述解决方案非常慢，并且将您限制为 1 个 url（好吧，不是真的，但我敢说，当您的用户不耐烦地等待结果时，您可以使用 Rhino 抓取 10 个 url）。

另一种方法是使用云抓取解决方案。您的好处是不会浪费手机带宽来下载您不会使用的内容。

尝试这个解决方案：Bobik Java SDK

它使您能够在几秒钟内抓取多达数百个网站