在Ruby/Rails中,如何编码/转义URL中的特殊字符?

jpw*_*ynn 15 ruby open-uri urlencode

在使用OpenURI之前,如何编码或"转义"URL open(url)

我们使用OpenURI打开远程URL并返回xml:

getresult = open(url).read
Run Code Online (Sandbox Code Playgroud)

问题是URL包含一些用户输入文本,其中包含空格和其他字符,包括"+","&","?"等可能,因此我们需要安全地转义URL.我在使用Net :: HTTP时看到了很多例子,但是没有为OpenURI找到任何例子.

我们还需要能够解析我们在会话变量中收到的类似字符串,因此我们需要倒数函数.

Ern*_*est 29

请勿使用,URI.escape因为它已在1.9中弃用.

Rails的Active Support增加了Hash#to_query:

 {foo: 'asd asdf', bar: '"<#$dfs'}.to_query
 # => "bar=%22%3C%23%24dfs&foo=asd+asdf"
Run Code Online (Sandbox Code Playgroud)

此外,正如您所看到的,它尝试以相同的方式对查询参数进行排序,这对HTTP缓存很有用.

  • @Ed_,谢谢-我粘贴了指向Object#to_query的无效链接,该链接应为Hash#to_query。 (2认同)

Jac*_*cob 14

Ruby标准库拯救:

require 'uri'
user_text = URI.escape(user_text)
url = "http://example.com/#{user_text}"
result = open(url).read
Run Code Online (Sandbox Code Playgroud)

有关URI :: Escape模块文档,请参阅更多内容.它还有一个方法来做反(unescape)

  • 哦,只是看到URI.encode采用完整的URL.难怪它会给出问题.所以...不要使用它;) (2认同)

Ars*_*en7 8

您必须考虑的主要事项是编写完整URL 之前必须单独转义键和值.

获取完整URL并尝试在之后将其转义的所有方法都会被破坏,因为它们无法判断是否有任何字符&=字符应该是分隔符,或者可能是值的一部分(或键的一部分).

CGI库似乎做得很好,除了空间字符,传统上编码为+,现在应编码为%20.但这很容易解决.

请考虑以下事项:

require 'cgi'

def encode_component(s)
  # The space-encoding is a problem:
  CGI.escape(s).gsub('+','%20')
end

def url_with_params(path, args = {})
  return path if args.empty?
  path + "?" + args.map do |k,v|
    "#{encode_component(k.to_s)}=#{encode_component(v.to_s)}" 
  end.join("&")
end

def params_from_url(url)
  path,query = url.split('?',2)
  return [path,{}] unless query
  q = query.split('&').inject({}) do |memo,p|
    k,v = p.split('=',2)
    memo[CGI.unescape(k)] = CGI.unescape(v)
    memo
  end
  return [path, q]
end

u = url_with_params( "http://example.com",
                            "x[1]"  => "& ?=/",
                            "2+2=4" => "true" )

# "http://example.com?x%5B1%5D=%26%20%3F%3D%2F&2%2B2%3D4=true"

params_from_url(u)
# ["http://example.com", {"x[1]"=>"& ?=/", "2+2=4"=>"true"}]
Run Code Online (Sandbox Code Playgroud)

  • 不要使用CGI.escape,它违反规范并将空格转换为+而不是%20 (2认同)

the*_*Man 2

Ruby 有内置的URI库和Addressable gem,特别是 Addressable::URI

我更喜欢Addressable::URI。它的功能非常齐全,并在您使用该方法时为您处理编码query_values=

我已经看到一些关于 URI 的讨论经历了一些成长的烦恼,所以我倾向于不去处理编​​码/转义,直到这些事情得到解决: