检查字符串是否以列表中的一个字符串结尾

The*_*eer 206 python string list

编写以下代码的pythonic方式是什么?

extensions = ['.mp3','.avi']
file_name = 'test.mp3'

for extension in extensions:
    if file_name.endswith(extension):
        #do stuff
Run Code Online (Sandbox Code Playgroud)

我有一个模糊的记忆,for可以避免循环的显式声明并写入if条件.这是真的?

fal*_*tru 416

虽然并不广为人知,但str.endswith也接受一个元组.你不需要循环.

>>> 'test.mp3'.endswith(('.mp3', '.avi'))
True
Run Code Online (Sandbox Code Playgroud)

  • 你知道它为什么不接受一个列表而是一个元组吗?只是好奇 (10认同)
  • 如果要检查字符串是否以字母结尾:`import string; str.endswith(tuple(string.ascii_lowercase))` (4认同)
  • @falsetru答案中的链接未明确回答该问题。它仅提及它*可以*接受元组,而不是为什么它*不能*接受列表的原因。由于它们都是序列,所以我唯一可能看到的区别是列表是可变的,而元组是不可变的。我可能是错的,但是我看不到任何其他明确说明原因的原因。 (2认同)
  • 仅需注意,`endswith`仅接受python 2.5及更高版本的元组 (2认同)
  • @ilyail3:我怀疑目标是推动人们走向高效的构造。99% 的情况下,要测试的后缀是常量字符串文字。如果将它们放入“列表”中,CPython 优化器(不知道“endswith”不会存储/改变它们)必须在*每次*调用时重建“列表”。将它们放入“元组”中,优化器可以在编译时存储“元组”,并在每次调用时从常量数组​​中廉价地加载它。类似于在可迭代字符串上使用“sum”获得的推动;无论哪种方式都可以工作,但错误的方式代码会变慢。 (2认同)

Jon*_*nts 42

只需使用:

if file_name.endswith(tuple(extensions)):
Run Code Online (Sandbox Code Playgroud)


Aka*_*ngh 9

另一种可以返回匹配字符串列表的方法是

sample = "alexis has the control"
matched_strings = filter(sample.endswith, ["trol", "ol", "troll"])
print matched_strings
['trol', 'ol']
Run Code Online (Sandbox Code Playgroud)


ale*_*cxe 6

从文件中获取扩展名,看看它是否在扩展集中:

>>> import os
>>> extensions = set(['.mp3','.avi'])
>>> file_name = 'test.mp3'
>>> extension = os.path.splitext(file_name)[1]
>>> extension in extensions
True
Run Code Online (Sandbox Code Playgroud)

使用集合因为集合中查找的时间复杂度为O(1)(docs).

  • 只需要注意当你提到效率时,对于相当短的元组,带有实体元组的`.endswith()`将比设置查找更快 (8认同)
  • 另请注意,在2.7和更新版本中,您可以使用集合的数学语法,`{'.mp3','.avi'}`,它可以避免额外的类型转换,并且根据您的背景可能更具可读性('虽然它可能会导致与词典混淆,并且不能用于创建空集). (2认同)

小智 6

有两种方法:正则表达式和字符串(str)方法。

字符串方法通常更快( ~2x )。

import re, timeit
p = re.compile('.*(.mp3|.avi)$', re.IGNORECASE)
file_name = 'test.mp3'
print(bool(t.match(file_name))
%timeit bool(t.match(file_name)
Run Code Online (Sandbox Code Playgroud)

每个循环 792 ns ± 1.83 ns(7 次运行的平均值 ± 标准偏差,每次 1000000 次循环)

file_name = 'test.mp3'
extensions = ('.mp3','.avi')
print(file_name.lower().endswith(extensions))
%timeit file_name.lower().endswith(extensions)
Run Code Online (Sandbox Code Playgroud)

每个循环 274 ns ± 4.22 ns(7 次运行的平均值 ± 标准偏差,每次 1000000 次循环)