如何让我的比赛在vim中不贪婪?

Mar*_*iek 469 regex vim regex-greedy

我有一个很大的HTML文件,有很多标记,如下所示:

<p class="MsoNormal" style="margin: 0in 0in 0pt;">
  <span style="font-size: small; font-family: Times New Roman;">stuff here</span>
</p>
Run Code Online (Sandbox Code Playgroud)

我正在尝试进行Vim搜索和替换以摆脱所有class="",style=""但我无法完成匹配.

我的第一次尝试是这样的

%s/style=".*?"//g
Run Code Online (Sandbox Code Playgroud)

但Vim似乎并不喜欢?.不幸的是,删除?使得比赛过于贪婪.

我如何才能使我的比赛不合适?

Ran*_*ris 719

而不是.*使用.\{-}.

%s/style=".\{-}"//g

另外,请参阅 :help non-greedy

  • 一切都有自己的正则表达式语言......这是正则表达式最大的问题之一. (91认同)
  • @Shurane @Ziggy Mnemonic:控制重复次数,如`{1,3}`做(大括号).减号`-`表示:尽可能少地重复(little == minus);) (46认同)
  • 不是很直观,这只是vim的事吗? (36认同)
  • 许多这些工具大约在同一时间成熟,并独立开发了他们自己的正则表达语言方言.其中许多工具也试图解决不同的问题,因此在这些实现中,语法可能会有很大的不同.我们必须接受这就是现实世界的运作方式,尽管它有时会让我们的生活变得更加艰难.幸运的是,现在很多工具至少提供了与Perl兼容的正则表达式实现.不幸的是,Vim不是其中之一. (35认同)
  • 如果像我这样的人将他们的搜索默认为`\ v`(非常神奇的旗帜),你会想要使用`.{ - }`. (14认同)
  • 是.Vim有自己的正则表达式语言. (7认同)
  • @GlennMaynard你错了; 检查[这个答案](http://stackoverflow.com/a/3604643/797744)看看为什么. (7认同)
  • 我使用无数工具的正则表达式,它们几乎都是一样的.使用非标准正则表达式语言而不是正则表达式的错误是Vim的错. (3认同)
  • 我正在寻找非贪婪的一个或多个,比如perl中的`/.+?/`.帮助文件给出了这个语法,即`.\ { - 1,}`.(1是下限.) (3认同)
  • 为什么我们必须逃避第一个`\ {`而不是第二个`}`? (3认同)
  • @knub出于同样的原因,当你这样做时,你不必同时逃避它们,例如,`a\{2}`.你正在逃避整个`{...}`原子,而不是单个字符. (3认同)

小智 56

使用{ - }运算符在vim中进行非贪婪搜索.像这样:

%s/style=".\{-}"//g
Run Code Online (Sandbox Code Playgroud)

试一试:

:help non-greedy
Run Code Online (Sandbox Code Playgroud)


Pau*_*lin 48

怎么了?

%s/style="[^"]*"//g
Run Code Online (Sandbox Code Playgroud)

  • 虽然为了我自己的利益,我仍然希望更好地理解不合适的事情. (6认同)

小智 15

如果你更舒服PCRE正则表达式语法,那

  1. 正如你在OP中所要求的,支持非贪婪的运算符?和
  2. 不需要回溯分组和基数运算符(完全违反直觉的vim语法要求,因为你没有匹配文字字符而是指定运算符); 和
  3. 你有[g] vim用perl功能编译,测试使用

    :ver和检查功能; 如果+ perl在那里你很高兴去)

尝试搜索/替换使用

:perldo s///
Run Code Online (Sandbox Code Playgroud)

例.在img标签中交换src和alt属性:

<p class="logo"><a href="/"><img src="/caminoglobal_en/includes/themes/camino/images/header_logo.png" alt=""></a></p>

:perldo s/(src=".*?")\s+(alt=".*?")/$2 $1/

<p class="logo"><a href="/"><img alt="" src="/caminoglobal_en/includes/themes/camino/images/header_logo.png"></a></p>
Run Code Online (Sandbox Code Playgroud)


Wil*_*ell 12

我发现这类问题的一个很好的解决方案是:

:%!sed ...

(或者perl,如果你愿意的话).IOW,而不是学习vim的正则表达式特性,使用你已经知道的工具.使用perl会使?修饰符工作不匹配的匹配.

  • 好点,但能够做`/ pattern`来检查你在应用它之前是否正确匹配模式并在你的vim正则表达式中使用`c`修饰符也很好:) (2认同)

JJo*_*oao 5

\v(如几条评论中所建议的)

:%s/\v(style|class)\=".{-}"//g
Run Code Online (Sandbox Code Playgroud)


bai*_*ain 5

插件eregex.vim处理 Perl 风格的非贪婪运算*?+?