页面上的一个块由JavaScript填充内容,在使用Jsoup加载页面后,没有任何信息.有没有办法在解析页面时获取JavaScript生成的内容Jsoup?
无法粘贴页面代码,因为它太长了:http://pastebin.com/qw4Rfqgw
这是我需要的内容元素: <div id='tags_list'></div>
我需要用Java获取这些信息.最好使用Jsoup.元素是JavaScript的帮助领域:
<div id="tags_list">
<a href="/tagsc0t20099.html" style="font-size:14;">?????????</a>
<a href="/tagsc0t1879.html" style="font-size:14;">Sr</a>
<a href="/tagsc0t3140.html" style="font-size:14;">??????????????</a>
</div>
Run Code Online (Sandbox Code Playgroud)
Java代码:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.IOException;
public class Test
{
public static void main( String[] args )
{
try
{
Document Doc = Jsoup.connect( "http://www.bestreferat.ru/referat-32558.html" ).get();
Elements Tags = Doc.select( "#tags_list a" );
for ( Element Tag : Tags )
{
System.out.println( Tag.text() );
}
}
catch ( IOException e )
{ …Run Code Online (Sandbox Code Playgroud) 我想知道是否有任何类似于PhantomJS的Java库.我想要实现的是能够模拟表单登录并从网页提交动作,以及也可以进行页面抓取.我知道jsoup可以进行页面抓取而不是页面自动化.
提前致谢!
干杯,亚历克斯