使用RSelenium读取下拉菜单元素中的值

Slo*_*ner 4 selenium r web-scraping rselenium

我正在使用RSelenium导航到网站并与元素进行交互.

问题:使用RSelenium,如何在下拉菜单中阅读选项列表,以便我可以识别可用的最新月份并使用它将下拉列表设置为正确的值?

某个站点上,为用户提供了一个下拉菜单,用于设置一年中的月份,从而定义用于依次显示或下载月度数据的日期范围的结束点.随着全年提供额外数月的数据,下拉列表中的选项会发生变化.

下拉菜单选项

截至7月底,下降将有1个选项,1月至6月.请注意,特定月份的数据会在该月末后的4-6周内发布,因此您不会在7月底之前获得6月份的数据,依此类推.我可以使用数字1到12设置值而没有任何问题,前提是下拉列表实际上包含相应的选项.

例如,如果7月的数据尚未发布(即,如果7月尚未出现在选项的下拉列表中),并且如果我尝试将下拉列表设置为"7",我将收到错误,我想避免.数据没有定期出现,因此我不能简单地假设月X的数据将出现在日期Y.

我相信Selenium本身有一个辅助类可用,但我不确定我是否可以通过RSelenium访问它.

示例代码如下 - 可能有点松懈,因为我还远未熟悉该软件包.

library(RSelenium)
RSelenium::checkForServer()
RSelenium::startServer()

remDr <- remoteDriver(remoteServerAddr = "localhost",
                      port = 4444,
                      browserName = "firefox"
                      )
remDr <- remoteDriver()
Sys.sleep(5)
remDr$open()
remDr$getStatus()

remDr$navigate("http://jamaserv.jama.or.jp/newdb/eng/index.html")

## Switch to left frame
frameElems <- remDr$findElements(using = "tag name", "frame")
sapply(frameElems, function(x){x$getElementAttribute("src")})
remDr$switchToFrame(frameElems[[1]])

webElem <- remDr$findElement(using = 'xpath', "//select[@name='txtTargetToMm']")

## Use javascript to set values
script <- paste0("arguments[0].value = '", 2, "'; arguments[0].onchange();") # set to February
remDr$executeScript(script, list(webElem))
webElem$getElementAttribute('value')    # check to see if it worked
Run Code Online (Sandbox Code Playgroud)

jdh*_*son 5

您可以使用该selectTag方法与HTML select元素进行交互:

library(RSelenium)

rD <- rsDriver(verbose = F)
remDr <- rD$client
remDr$navigate("http://jamaserv.jama.or.jp/newdb/eng/index.html")

## Switch to left frame
frameElems <- remDr$findElements(using = "tag name", "frame")
sapply(frameElems, function(x){x$getElementAttribute("src")})
remDr$switchToFrame(frameElems[[1]])

webElem <- remDr$findElement(using = 'xpath', "//select[@name='txtTargetToMm']")
opts <- webElem$selectTag()

> opts$text
[1] "JANUARY"   "FEBRUARY"  "MARCH"     "APRIL"     "MAY"       "JUNE"      "JULY"      "AUGUST"   
[9] "SEPTEMBER" "OCTOBER"   "NOVEMBER"  "DECEMBER" 
> opts$value
[1] "1"  "2"  "3"  "4"  "5"  "6"  "7"  "8"  "9"  "10" "11" "12"
> opts$selected
[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE

# select the third month (march)
opts$elements[[3]]$clickElement()

# check whether it is selected
opts <- webElem$selectTag()
opts$selected

> opts$selected
[1] FALSE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

rm(rD)
gc()
Run Code Online (Sandbox Code Playgroud)

  • 如果我尝试运行您的代码,但我在尝试执行 `opts$elements[[3]]$clickElement()` 时收到错误 `Error: try to apply non-function`。 (2认同)