在python中使用正则表达式从文件名中获取剧集编号

Question

在python中使用正则表达式从文件名中获取剧集编号

多年来，我在媒体服务器上收集了大量电视剧。我编写了一个脚本来检查并使用适当的文件名方案重命名它们，但是在尝试针对多个命名方案时，我在使用正则表达式时遇到了一些麻烦。

这是我当前的功能，它可以很好地从具有“s01e01”方案的文件名中获取剧集编号

def getEpisode(filename):
    matches = re.findall(r"e[0-9][0-9]", filename)
    if len(matches) == 1:
        episode = matches[0]
        episode = stripEp(episode)
        return episode  
    else:
        return False

def stripEp(target):
    target = target.strip()
    target = target.strip('abcdefghijklmnopqrstuvwxyz.')
    return target

Run Code Online (Sandbox Code Playgroud)

我需要做的是在使用多个方案时从文件名中获取剧集编号。我花了一段时间谷歌搜索并尝试了以下内容。

matches = re.findall(r"(e[0-9][0-9]|E[0-9][0-9]|x[0-9][0-9]|X[0-9][0-9]|episode [0-9][0-9]|Episode [0-9][0-9]|\n[0-9][0-9])", filename)

Run Code Online (Sandbox Code Playgroud)

这适用于正则表达式测试器，例如RegexPal和 Python Regex Tool

但是，当我将其插入我的函数时，它不起作用。这让我很难过，因为它似乎在我上面链接的 python 正则表达式工具中工作。任何帮助将不胜感激。

编辑：以下是文件使用的方案的一些示例。

Series Name s01e01.avi

Series Name 1x01.avi

Series Name episode 01.avi

01 Episode Title.avi

Run Code Online (Sandbox Code Playgroud)

Answer 1

unu*_*tbu 5

文件名不包含'\n'. 您可以使用^来指示字符串的开头，而不是：

def getEpisode(filename):
    match = re.search(
        r'''(?ix)                 # Ignore case (i), and use verbose regex (x)
        (?:                       # non-grouping pattern
          e|x|episode|^           # e or x or episode or start of a line
          )                       # end non-grouping pattern 
        \s*                       # 0-or-more whitespaces
        (\d{2})                   # exactly 2 digits
        ''', filename)
    if match:
        return match.group(1)

tests = (
    'Series Name s01e01.avi',
    'Series Name 1x01.avi',
    'Series Name episode 01.avi',
    '01 Episode Title.avi'
    )
for filename in tests:
    print(getEpisode(filename))

Run Code Online (Sandbox Code Playgroud)

产量

Run Code Online (Sandbox Code Playgroud)

我删除了，else: return False因为None如果Python到达函数的末尾而没有返回任何内容，它就会返回。由于None具有布尔值False，您可以测试与epsiode = getEpisode(filename); if episode: ....

归档时间：	13 年，9 月前
查看次数：	4480 次
最近记录：	5 年前