相关疑难解决方法(0)

页面内容加载了JavaScript,Jsoup看不到它

页面上的一个块由JavaScript填充内容,在使用Jsoup加载页面后,没有任何信息.有没有办法在解析页面时获取JavaScript生成的内容Jsoup

无法粘贴页面代码,因为它太长了:http://pastebin.com/qw4Rfqgw

这是我需要的内容元素: <div id='tags_list'></div>

我需要用Java获取这些信息.最好使用Jsoup.元素是JavaScript的帮助领域:

<div id="tags_list">
    <a href="/tagsc0t20099.html" style="font-size:14;">?????????</a>
    <a href="/tagsc0t1879.html" style="font-size:14;">Sr</a>
    <a href="/tagsc0t3140.html" style="font-size:14;">??????????????</a>
</div>
Run Code Online (Sandbox Code Playgroud)

Java代码:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;

public class Test
{
    public static void main( String[] args )
    {
        try
        {
            Document Doc = Jsoup.connect( "http://www.bestreferat.ru/referat-32558.html" ).get();
            Elements Tags = Doc.select( "#tags_list a" );

            for ( Element Tag : Tags )
            {
                System.out.println( Tag.text() );
            }
        }
        catch ( IOException e )
        { …
Run Code Online (Sandbox Code Playgroud)

html javascript java parsing jsoup

28
推荐指数
4
解决办法
4万
查看次数

任何Java等同于PhantomJS?

我想知道是否有任何类似于PhantomJS的Java库.我想要实现的是能够模拟表单登录并从网页提交动作,以及也可以进行页面抓取.我知道jsoup可以进行页面抓取而不是页面自动化.

提前致谢!

干杯,亚历克斯

java automated-tests web-scraping selenium-webdriver

12
推荐指数
3
解决办法
3万
查看次数