消除用户正则表达式

Dan*_*vin 4 ruby regex security sanitization ruby-on-rails

我想编写一个允许用户根据正则表达式匹配数据的函数,但我担心用户字符串的卫生.我知道使用SQL查询可以使用绑定变量来避免SQL注入攻击,但我不确定是否有这样的regexp机制.我看到有Regexp.escape,但我想允许有效的正则表达式.

这是示例函数:

  def tagged?(text)
    tags.each do |tag|
      return true if text =~ /#{tag.name}/i
    end
    return false
  end
Run Code Online (Sandbox Code Playgroud)

因为我只是直接匹配tag.name是否有人可以插入一个Proc调用或什么来打破正则表达式并造成破坏?

任何关于最佳实践的建议将不胜感激.

tad*_*man 5

Regexp中的插值字符串不会被执行,但会产生恼人的警告:

/#{exit -3}/.match('test')
# => exits

foo = '#{exit -3}'
/#{foo}/.match('test')
# => warning: regexp has invalid interval
# => warning: regexp has `}' without escape
Run Code Online (Sandbox Code Playgroud)

这两个警告似乎分别与开场#{和结束}有关,并且是独立的.

作为一种更高效的策略,您可能希望将标记列表清理为可以运行一次的组合正则表达式.构造和测试N个正则表达式的效率通常远低于具有N个部分的1个.

也许是这样的:

class Taggable
  def tags
    @tags
  end

  def tags=(value)
    @tags = value

    @tag_regexp = Regexp.new(
      [
        '^(?:',
        @tags.collect do |tag|
          '(?:' + tag.sub(/\#\{/, '\\#\\{').sub(/([^\\])\}/, '\1\\}') + ')'
        end.join('|'),
        ')$'
      ].to_s,
      Regexp::IGNORECASE
    )
  end

  def tagged?(text)
    !!text.match(@tag_regexp)
  end
end
Run Code Online (Sandbox Code Playgroud)

这可以这样使用:

e = Taggable.new
e.tags = %w[ #{exit-3} .*\.gif .*\.png .*\.jpe?g ]

puts e.tagged?('foo.gif').inspect
Run Code Online (Sandbox Code Playgroud)

如果执行了退出调用,程序将暂停,但它只是将其解释为文字字符串.为了避免警告,它会被反斜杠转义.