我需要从使用 cookie 保护的网站下载信息。我手动传递此保护,然后将 cookie 插入到httr.
这是类似的主题,但它没有解决我的问题:(为 httr 复制 cookie)
library(httr)
url<-"http://smida.gov.ua/db/emitent/year/xml/showform/32153/125/templ"
cook<-"_SMIDA=9117a9eb136353bd6956651bd59acd37; __utmt=1; __utma=29983421.1729484844.1413489369.1413625619.1413627797.3; __utmb=29983421.7.10.1413627797; __utmc=29983421; __utmz=29983421.1413489369.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none)"
response <- GET(url, config(cookie= cook))
content(x = response,as = 'text', encoding = "UTF-8")
Run Code Online (Sandbox Code Playgroud)
因此,当我使用内容时,它会返回我未登录的信息(就像没有 cookie 时那样)
我怎么解决这个问题?
测试凭据是 login: mytest2, pass: qwerty12)
当我尝试使用R中的download.file()下载网页并且没有这样的网站时,函数会自动创建一个空文件.
如何避免创建空文件?