如何在特定字符串前面找到所有出现的字符序列？

Question

如何在特定字符串前面找到所有出现的字符序列？

我正在尝试从EBML定义中提取所有匹配,如下所示:

| + A track
|  + Track number: 3
|  + Track UID: 724222477
|  + Track type: subtitles
...
|  + Language: eng
...
| + A track
|  + Track number: 4
|  + Track UID: 745646561
|  + Track type: subtitles
...
|  + Language: jpn
...

Run Code Online (Sandbox Code Playgroud)

我希望所有出现的"语言:???" 当前面有"Track type:subtitles".我尝试了几种变体:

Track type: subtitles.*Language: (\w\w\w)

Run Code Online (Sandbox Code Playgroud)

我在Ruby中使用多行修饰符,因此它匹配换行符(如其他语言中的's'修饰符).

这有助于获得最后一次出现,在上面的例子中,它将是'jpn',例如:

string.scan(/Track type: subtitles.*Language: (\w\w\w)/m)
=> [["jpn"]]

Run Code Online (Sandbox Code Playgroud)

结果我想:

=> [["eng"], ["jpn"]]

Run Code Online (Sandbox Code Playgroud)

什么是正确的正则表达式来实现这一目标？

Answer 1

Jer*_*ten 7

你需要通过改变这个来使你的正则表达式变得非贪婪:

.*

Run Code Online (Sandbox Code Playgroud)

对此:

.*?

Run Code Online (Sandbox Code Playgroud)

你的正则表达式是从第一次出现Track type: subtitles到最后出现的匹配Language: (\w\w\w).使它非贪婪将起作用,因为它匹配尽可能少的字符.

归档时间：	17 年，4 月前
查看次数：	542 次
最近记录：	15 年，3 月前