检查字符串是否以列表中的一个字符串结尾

Question

检查字符串是否以列表中的一个字符串结尾

编写以下代码的pythonic方式是什么？

extensions = ['.mp3','.avi']
file_name = 'test.mp3'

for extension in extensions:
    if file_name.endswith(extension):
        #do stuff

Run Code Online (Sandbox Code Playgroud)

我有一个模糊的记忆,for可以避免循环的显式声明并写入if条件.这是真的？

Answer 1

fal*_*tru 416

虽然并不广为人知,但str.endswith也接受一个元组.你不需要循环.

>>> 'test.mp3'.endswith(('.mp3', '.avi'))
True

Run Code Online (Sandbox Code Playgroud)

你知道它为什么不接受一个列表而是一个元组吗？只是好奇 (10认同)
如果要检查字符串是否以字母结尾：`import string; str.endswith（tuple（string.ascii_lowercase））` (4认同)
@falsetru答案中的链接未明确回答该问题。它仅提及它*可以*接受元组，而不是为什么它*不能*接受列表的原因。由于它们都是序列，所以我唯一可能看到的区别是列表是可变的，而元组是不可变的。我可能是错的，但是我看不到任何其他明确说明原因的原因。 (2认同)
仅需注意，`endswith`仅接受python 2.5及更高版本的元组 (2认同)
@ilyail3：我怀疑目标是推动人们走向高效的构造。99% 的情况下，要测试的后缀是常量字符串文字。如果将它们放入“列表”中，CPython 优化器（不知道“endswith”不会存储/改变它们）必须在*每次*调用时重建“列表”。将它们放入“元组”中，优化器可以在编译时存储“元组”，并在每次调用时从常量数组中廉价地加载它。类似于在可迭代字符串上使用“sum”获得的推动；无论哪种方式都可以工作，但错误的方式代码会变慢。 (2认同)

Answer 2

Jon*_*nts 42

只需使用:

if file_name.endswith(tuple(extensions)):

Run Code Online (Sandbox Code Playgroud)

Answer 3

Aka*_*ngh 9

另一种可以返回匹配字符串列表的方法是

sample = "alexis has the control"
matched_strings = filter(sample.endswith, ["trol", "ol", "troll"])
print matched_strings
['trol', 'ol']

Run Code Online (Sandbox Code Playgroud)

Answer 4

ale*_*cxe 6

从文件中获取扩展名,看看它是否在扩展集中:

>>> import os
>>> extensions = set(['.mp3','.avi'])
>>> file_name = 'test.mp3'
>>> extension = os.path.splitext(file_name)[1]
>>> extension in extensions
True

Run Code Online (Sandbox Code Playgroud)

使用集合因为集合中查找的时间复杂度为O(1)(docs).

只需要注意当你提到效率时,对于相当短的元组,带有实体元组的`.endswith()`将比设置查找更快 (8认同)
另请注意,在2.7和更新版本中,您可以使用集合的数学语法,`{'.mp3','.avi'}`,它可以避免额外的类型转换,并且根据您的背景可能更具可读性('虽然它可能会导致与词典混淆,并且不能用于创建空集). (2认同)

Answer 5

小智 6

有两种方法：正则表达式和字符串（str）方法。

字符串方法通常更快（ ~2x ）。

import re, timeit
p = re.compile('.*(.mp3|.avi)$', re.IGNORECASE)
file_name = 'test.mp3'
print(bool(t.match(file_name))
%timeit bool(t.match(file_name)

Run Code Online (Sandbox Code Playgroud)

每个循环 792 ns ± 1.83 ns（7 次运行的平均值 ± 标准偏差，每次 1000000 次循环）

file_name = 'test.mp3'
extensions = ('.mp3','.avi')
print(file_name.lower().endswith(extensions))
%timeit file_name.lower().endswith(extensions)

Run Code Online (Sandbox Code Playgroud)

每个循环 274 ns ± 4.22 ns（7 次运行的平均值 ± 标准偏差，每次 1000000 次循环）

归档时间：	12 年，5 月前
查看次数：	112676 次
最近记录：	7 年，1 月前