我需要匹配所有这些开始标记:
<p>
<a href="foo">
Run Code Online (Sandbox Code Playgroud)
但不是这些:
<br />
<hr class="foo" />
Run Code Online (Sandbox Code Playgroud)
我想出了这个,并希望确保我做对了.我只抓住了a-z.
<([a-z]+) *[^/]*?>
Run Code Online (Sandbox Code Playgroud)
我相信它说:
/,然后我有这个权利吗?更重要的是,你怎么看?
我正在尝试匹配并打破一个典型的电视洪流的标题:
MyTV.Show.S09E01.HDTV.XviD
MyTV.Show.S10E02.HDTV.XviD
MyTV.Show.901.HDTV.XviD
MyTV.Show.1102.HDTV.XviD
我试图将这些字符串分成3个捕获组,每个条目:Title,Season,Episode.
我可以轻松处理前2个:
^([a-zA-Z0-9.]*)\.S([0-9]{1,2})E([0-9]{1,2}).*$
Run Code Online (Sandbox Code Playgroud)
然而,第三和第四个证明很难打破季节和插曲.如果我可以倒退,那会更容易.例如,对于"901",如果我可以向后工作,则将第一个数字作为数字编号,在此之前剩余的任何数字是季节数.
有没有人知道如何将这些字符串分解为相关的捕获组?