jbr*_*nan 2 ruby regex string html-sanitizing
我正在尝试清理一些HTML并删除一个标签(我真的想避免使用nokogiri等).所以我有以下字符串出现我想要摆脱:
<div class="the_class>Some junk here that's different every time</div>
Run Code Online (Sandbox Code Playgroud)
这在我的字符串中只显示一次,我想找到一种方法将其删除.我已经尝试用正则表达式捕获它,但我找不到一个有效的.
我已经尝试过/<div class="the_class">(.*)<\/div>/m,但是它也可以匹配并包含</div>文档中的任何其他标签,这是我不想要的.
关于如何处理这个的任何想法?
我相信你正在寻找一个非贪婪的正则表达式,如下所示:
/<div class="the_class">(.*?)<\/div>/m
Run Code Online (Sandbox Code Playgroud)
注意添加?.现在,捕获组将捕获尽可能少(非贪婪),而不是尽可能多(贪婪).