对于Ruby来说,有没有比CGI更好的HTML转义和转义工具？

Question

对于Ruby来说,有没有比CGI更好的HTML转义和转义工具？

CGI.escapeHTML是非常糟糕的,但CGI.unescapeHTML完全被塞了.例如:

require 'cgi'

CGI.unescapeHTML('&#8230;')
# => "…"                    # correct - an ellipsis

CGI.unescapeHTML('&hellip;')
# => "&hellip;"             # should be "…"

CGI.unescapeHTML('&#162;')
# => "\242"                 # correct - a cent

CGI.unescapeHTML('&cent;')
# => "&cent;"               # should be "\242"

CGI.escapeHTML("…")
# => "…"                    # should be "&#8230;"

Run Code Online (Sandbox Code Playgroud)

看来,unescapeHTML知道所有的数字代码加&,<,>,和".并且escapeHTML只知道最后四个 - 它没有做任何数字代码.我知道转义通常不需要那么强大,因为HTML将允许大多数字符的文字版本,除了CGI.escapeHTML知道的四个字符.但是,失业应该会更好.

有没有更好的工具,至少对于unescaping？

Answer 1

tit*_*ous 28

htmlentities gem应该可以解决这个问题:

require 'rubygems'
require 'htmlentities'

coder = HTMLEntities.new

coder.decode('&#8230;') # => "…"
coder.decode('&hellip;') # => "…"
coder.decode('&#162;') # => "¢"
coder.decode('&cent;') # => "¢"
coder.encode("…", :named) # => "&hellip;"
coder.encode("…", :decimal) # => "&#8230;"

Run Code Online (Sandbox Code Playgroud)

归档时间：	17 年，1 月前
查看次数：	4862 次
最近记录：	17 年，1 月前