The*_*eer 206 python string list
编写以下代码的pythonic方式是什么?
extensions = ['.mp3','.avi']
file_name = 'test.mp3'
for extension in extensions:
if file_name.endswith(extension):
#do stuff
Run Code Online (Sandbox Code Playgroud)
我有一个模糊的记忆,for可以避免循环的显式声明并写入if条件.这是真的?
fal*_*tru 416
虽然并不广为人知,但str.endswith也接受一个元组.你不需要循环.
>>> 'test.mp3'.endswith(('.mp3', '.avi'))
True
Run Code Online (Sandbox Code Playgroud)
Jon*_*nts 42
只需使用:
if file_name.endswith(tuple(extensions)):
Run Code Online (Sandbox Code Playgroud)
另一种可以返回匹配字符串列表的方法是
sample = "alexis has the control"
matched_strings = filter(sample.endswith, ["trol", "ol", "troll"])
print matched_strings
['trol', 'ol']
Run Code Online (Sandbox Code Playgroud)
从文件中获取扩展名,看看它是否在扩展集中:
>>> import os
>>> extensions = set(['.mp3','.avi'])
>>> file_name = 'test.mp3'
>>> extension = os.path.splitext(file_name)[1]
>>> extension in extensions
True
Run Code Online (Sandbox Code Playgroud)
使用集合因为集合中查找的时间复杂度为O(1)(docs).
小智 6
有两种方法:正则表达式和字符串(str)方法。
字符串方法通常更快( ~2x )。
import re, timeit
p = re.compile('.*(.mp3|.avi)$', re.IGNORECASE)
file_name = 'test.mp3'
print(bool(t.match(file_name))
%timeit bool(t.match(file_name)
Run Code Online (Sandbox Code Playgroud)
每个循环 792 ns ± 1.83 ns(7 次运行的平均值 ± 标准偏差,每次 1000000 次循环)
file_name = 'test.mp3'
extensions = ('.mp3','.avi')
print(file_name.lower().endswith(extensions))
%timeit file_name.lower().endswith(extensions)
Run Code Online (Sandbox Code Playgroud)
每个循环 274 ns ± 4.22 ns(7 次运行的平均值 ± 标准偏差,每次 1000000 次循环)