Mis*_*lav 2 iframe r cross-domain web-scraping rselenium
我正在使用 R 版本 3.3.2。使用 Rselenium 包,我试图从这个网站上抓取一些数据:http ://www.dziv.hr/en/e-services/on-line-database-search/patents/
我正在使用 Rselenium,我的代码如下所示:
selServ <- RSelenium::startServer(javaargs = c("-Dwebdriver.gecko.driver=\"C:/Users/Mislav/Documents/geckodriver.exe\""))
remDr <- remoteDriver(extraCapabilities = list(marionette = TRUE))
remDr$open()
Sys.sleep(2)
# Simulate browser session and fill out form
remDr$navigate("http://www.dziv.hr/hr/e-usluge/pretrazivanje-baza-podataka/patent/")
Run Code Online (Sandbox Code Playgroud)
这不起作用:
webel <- remDr$findElement(using = "xpath", "/input[@id = 'TB1']")
Run Code Online (Sandbox Code Playgroud)
然后我想使用switchToFrame()函数切换到 iframe ,但是 iframe 不包含 id。
然后我有 tr 使用索引:webel <- remDr$switchToFrame(1) 但这只是返回 NULL
另外,我认识到,iframe 有不同的域。
是否可以从该网站 svrap 数据?
您可以只选择第一个iframe并将其传递给switchToFrame方法:
webElem <- remDr$findElements("css", "iframe")
remDr$switchToFrame(webElem[[1]])
webel <- remDr$findElement(using = "xpath", "//input[@id = 'TB1']")
Run Code Online (Sandbox Code Playgroud)