Aru*_*hit 6 ruby nokogiri ruby-1.9.3 selenium-webdriver
我使用Nokogiri如下:
require 'nokogiri'
require 'open-uri'
# Get a Nokogiri::HTML::Document for the page we’re interested in...
doc = Nokogiri::HTML(open('http://www.google.com/search?q=sparklemotion'))
Run Code Online (Sandbox Code Playgroud)
但我的不好,由于公司防火墙可能,我收到错误:
C:/Ruby193/lib/ruby/1.9.1/net/http.rb:762:in `initialize': getaddrinfo: No such
host is known. (SocketError)
Run Code Online (Sandbox Code Playgroud)
因此,我认为我将用于selenium-webdriver导航和nokogiri处理网页源html.
require "rubygems"
require "selenium-webdriver"
driver = Selenium::WebDriver.for :firefox
driver.get "http://www.google.com/search?q=sparklemotion"
Run Code Online (Sandbox Code Playgroud)
那么我在这里如何提供网页内容(html)nokogiri?
请在这里建议我.
Jus*_* Ko 13
您可以使用以下page_source方法从selenium-webdriver获取页面源:
driver.page_source
Run Code Online (Sandbox Code Playgroud)
所以你的脚本可能是:
require 'selenium-webdriver'
require 'nokogiri'
driver = Selenium::WebDriver.for :firefox
driver.get "http://www.google.com/"
doc = Nokogiri::HTML(driver.page_source)
# Do whatever with nokogiri
Run Code Online (Sandbox Code Playgroud)
也就是说,我不知道你为什么要使用nokogiri而不是selenium-webdriver.
| 归档时间: |
|
| 查看次数: |
1648 次 |
| 最近记录: |