用于匹配<blockquote>和</ blockquote>之间的单词的正则表达式

sen*_*hil 1 ruby regex

基本上我想在blockquotes之间删除单词文档.我是一个正则表达式newb甚至在使用rubular后,我也没有接近答案了.

任何帮助表示赞赏.

Tom*_*lak 10

使用HTML解析器并忘记正则表达式.正则表达式无法正确处理HTML.

doc = Nokogiri::HTML(your_html)
doc.xpath("//blockquote").remove
Run Code Online (Sandbox Code Playgroud)

From:使用Ruby从HTML文档中删除文本

如果你环顾四周,还有更多关于如何使用Nokogiri和XPath的例子.