如果您想要网页的原始来源,请不要使用Nokogiri.只需将网页直接作为字符串获取,然后不要将其提供给Nokogiri.例如:
require 'open-uri'
html = open('http://phrogz.net').read
puts html.length #=> 8461
puts html #=> ...raw source of the page...
Run Code Online (Sandbox Code Playgroud)
另一方面,如果您想要一个页面的JavaScript后修改内容(例如执行JavaScript代码的AJAX库来获取新内容并更改页面),那么您就不能使用Nokogiri.您需要使用Ruby来控制Web浏览器(例如,阅读Selenium或Watir).
| 归档时间: |
|
| 查看次数: |
3182 次 |
| 最近记录: |