网络抓取Yahoo!中的关键统计数据 R金融

ton*_*oyj 1 r web-scraping quantmod rvest quandl

有没有从Yahoo!抓取数据的经验的人?带R?的财务关键统计页面?我从HTML直接使用我熟悉的刮擦数据read_htmlhtml_nodes()以及html_text()rvest包。但是,此网页的MSFT关键统计信息有些复杂,我不确定是否所有统计信息都保存在XHR,JS或Doc中。我猜数据存储在JSON中。如果有人知道使用R提取和解析此网页数据的好方法,请回答我的问题,在此先感谢您!

或者,如果有一种更便捷的方法可以通过quantmod或提取这些指标Quandl,请告诉我,这将是一个非常好的解决方案!

Aar*_*rom 6

我知道这是一个较旧的线程,但是我用它来刮擦Yahoo Analyst表,所以我想我会分享。

# Yahoo webscrape Analysts
library(XML)

symbol = "HD"
url <- paste('https://finance.yahoo.com/quote/HD/analysts?p=',symbol,sep="")
webpage <- readLines(url)
html <- htmlTreeParse(webpage, useInternalNodes = TRUE, asText = TRUE)
tableNodes <- getNodeSet(html, "//table")

earningEstimates <- readHTMLTable(tableNodes[[1]])
revenueEstimates <- readHTMLTable(tableNodes[[2]])
earningHistory <- readHTMLTable(tableNodes[[3]])
epsTrend <- readHTMLTable(tableNodes[[4]])
epsRevisions <- readHTMLTable(tableNodes[[5]])
growthEst <- readHTMLTable(tableNodes[[6]])
Run Code Online (Sandbox Code Playgroud)

干杯,欢呼