网络抓取Yahoo!中的关键统计数据 R金融

Question

网络抓取Yahoo!中的关键统计数据 R金融

ton*_*oyj 1 r web-scraping quantmod rvest quandl

有没有从Yahoo!抓取数据的经验的人？带R？的财务关键统计页面？我从HTML直接使用我熟悉的刮擦数据read_html，html_nodes()以及html_text()从rvest包。但是，此网页的MSFT关键统计信息有些复杂，我不确定是否所有统计信息都保存在XHR，JS或Doc中。我猜数据存储在JSON中。如果有人知道使用R提取和解析此网页数据的好方法，请回答我的问题，在此先感谢您！

或者，如果有一种更便捷的方法可以通过quantmod或提取这些指标Quandl，请告诉我，这将是一个非常好的解决方案！

Answer 1

Aar*_*rom 6

我知道这是一个较旧的线程，但是我用它来刮擦Yahoo Analyst表，所以我想我会分享。

# Yahoo webscrape Analysts
library(XML)

symbol = "HD"
url <- paste('https://finance.yahoo.com/quote/HD/analysts?p=',symbol,sep="")
webpage <- readLines(url)
html <- htmlTreeParse(webpage, useInternalNodes = TRUE, asText = TRUE)
tableNodes <- getNodeSet(html, "//table")

earningEstimates <- readHTMLTable(tableNodes[[1]])
revenueEstimates <- readHTMLTable(tableNodes[[2]])
earningHistory <- readHTMLTable(tableNodes[[3]])
epsTrend <- readHTMLTable(tableNodes[[4]])
epsRevisions <- readHTMLTable(tableNodes[[5]])
growthEst <- readHTMLTable(tableNodes[[6]])

Run Code Online (Sandbox Code Playgroud)

干杯，欢呼

归档时间：	9 年，1 月前
查看次数：	2747 次
最近记录：	7 年，8 月前