A.D*_*.D. 7 ruby whitespace mechanize nokogiri mechanize-ruby
我无法从字符串中删除空格.
我的HTML是:
<p class='your-price'>
Cena pro Vás: <strong>139 <small>K?</small></strong>
</p>
Run Code Online (Sandbox Code Playgroud)
我的代码是:
#encoding: utf-8
require 'rubygems'
require 'mechanize'
agent = Mechanize.new
site = agent.get("http://www.astratex.cz/podlozky-pod-raminka/doplnky")
price = site.search("//p[@class='your-price']/strong/text()")
val = price.first.text => "139 "
val.strip => "139 "
val.gsub(" ", "") => "139 "
Run Code Online (Sandbox Code Playgroud)
gsub
,strip
等等不起作用.为什么,我该如何解决这个问题?
val.class => String
val.dump => "\"139\\u{a0}\"" !
val.encoding => #<Encoding:UTF-8>
__ENCODING__ => #<Encoding:UTF-8>
Encoding.default_external => #<Encoding:UTF-8>
Run Code Online (Sandbox Code Playgroud)
我正在使用Ruby 1.9.3,因此Unicode不应该是问题.
ton*_*edz 23
strip
只删除ASCII
空格,你在这里得到的字符是Unicode不间断空格.
删除角色很容易.您可以gsub
通过提供带有字符代码的正则表达式来使用:
gsub(/\u00a0/, '')
您也可以调用gsub(/[[:space:]]/, '')
删除所有Unicode空格.有关详细信息,请查看文档
归档时间: |
|
查看次数: |
3996 次 |
最近记录: |