我正在尝试(在R中)从以下方面获取一些数据:
http://www.soccerbase.com/matches/results.sd?date=2012-11-04
也就是说,当我按下i按钮时,我想获得页面上显示的匹配细节.但是,单击按钮时显示的信息不包含在原始html代码中.我只能看到一条线(我希望数据包含在哪里)......
<span class="infoField"><a href="#" class="info finished" title="Show full match details"></a></span>
Run Code Online (Sandbox Code Playgroud)
......这几乎让我陷入了死胡同......任何想法?
require(XML)
require(RCurl)
dataurl<-'http://www.soccerbase.com/matches/results.sd?date=2012-11-04'
sdata<-htmlParse(dataurl)
sid<-xpathSApply(sdata,'//*/tr/@id')
sid<-gsub('^tgc','',sid)
mUrl<-paste0('http://www.soccerbase.com/matches/additional_information.sd?id_game=',sid)
Run Code Online (Sandbox Code Playgroud)
上面的代码将获取附加数据所需的 url。不过,我会向该网站核实有关收集其数据的信息。