ton*_*oyj 1 r web-scraping quantmod rvest quandl
有没有从Yahoo!抓取数据的经验的人?带R?的财务关键统计页面?我从HTML直接使用我熟悉的刮擦数据read_html
,html_nodes()
以及html_text()
从rvest
包。但是,此网页的MSFT关键统计信息有些复杂,我不确定是否所有统计信息都保存在XHR,JS或Doc中。我猜数据存储在JSON中。如果有人知道使用R提取和解析此网页数据的好方法,请回答我的问题,在此先感谢您!
或者,如果有一种更便捷的方法可以通过quantmod
或提取这些指标Quandl
,请告诉我,这将是一个非常好的解决方案!
我知道这是一个较旧的线程,但是我用它来刮擦Yahoo Analyst表,所以我想我会分享。
# Yahoo webscrape Analysts
library(XML)
symbol = "HD"
url <- paste('https://finance.yahoo.com/quote/HD/analysts?p=',symbol,sep="")
webpage <- readLines(url)
html <- htmlTreeParse(webpage, useInternalNodes = TRUE, asText = TRUE)
tableNodes <- getNodeSet(html, "//table")
earningEstimates <- readHTMLTable(tableNodes[[1]])
revenueEstimates <- readHTMLTable(tableNodes[[2]])
earningHistory <- readHTMLTable(tableNodes[[3]])
epsTrend <- readHTMLTable(tableNodes[[4]])
epsRevisions <- readHTMLTable(tableNodes[[5]])
growthEst <- readHTMLTable(tableNodes[[6]])
Run Code Online (Sandbox Code Playgroud)
干杯,欢呼