R-从URL / HTML对象/ HTML响应写入HTML文件

Question

R-从URL / HTML对象/ HTML响应写入HTML文件

我想使用R中的URL保存HTML文件。我试图分别在网站的URL上使用GET和的read_html功能httr和rvest程序包保存响应对象，然后在HTML上保存HTML。但这并不能保存网站的实际内容。

url = "https://facebook.com"
get_object = httr::GET(url); save(get_object, "file.html")
html_object = rvest::read_html(url); save(html_object, "file.html")

Run Code Online (Sandbox Code Playgroud)

这些方法都无法将实际网站的正确输出（即.html文件中的网页HTML内容）保存到HTML文件中。

Answer 1

cor*_*ory 5

str(object)用于弄清楚您正在使用什么。在这两种情况下，您都试图将非文本写入文本文件。

这是使用两个库获取文本并编写文本的方法...

url = "https://facebook.com"

library(httr)
get_object = GET(url)
cat(content(get_object, "text"), file="temp.html")

library(rvest)
html_object = read_html(url)
write_xml(html_object, file="temp.html")

Run Code Online (Sandbox Code Playgroud)

归档时间：	9 年，8 月前
查看次数：	2566 次
最近记录：	9 年，7 月前