首先,我发布这个是因为当我在寻找下面问题的解决方案时,我在stackoverflow上找不到一个.所以,我希望在这里添加一点知识库.
我需要处理目录中的一些文件,并且需要以数字方式对文件进行排序.我lambda在wiki.python.org上找到了一些关于排序的例子 - 特别是使用模式 - 我把它放在一起:
#!env/python
import re
tiffFiles = """ayurveda_1.tif
ayurveda_11.tif
ayurveda_13.tif
ayurveda_2.tif
ayurveda_20.tif
ayurveda_22.tif""".split('\n')
numPattern = re.compile('_(\d{1,2})\.', re.IGNORECASE)
tiffFiles.sort(cmp, key=lambda tFile:
int(numPattern.search(tFile).group(1)))
print tiffFiles
Run Code Online (Sandbox Code Playgroud)
我仍然是Python的新手,并且想问社区是否可以对此进行任何改进:缩短代码(删除lambda),性能,样式/可读性?
谢谢Zachary
Dan*_*olo 45
这称为"自然排序"或"人类排序"(与字典排序相反,这是默认排序). Ned B写了一个快速版本.
import re
def tryint(s):
try:
return int(s)
except:
return s
def alphanum_key(s):
""" Turn a string into a list of string and number chunks.
"z23a" -> ["z", 23, "a"]
"""
return [ tryint(c) for c in re.split('([0-9]+)', s) ]
def sort_nicely(l):
""" Sort the given list in the way that humans expect.
"""
l.sort(key=alphanum_key)
Run Code Online (Sandbox Code Playgroud)
它与你正在做的类似,但也许更广泛.
dkm*_*tt0 10
只需使用:
tiffFiles.sort(key=lambda var:[int(x) if x.isdigit() else x for x in re.findall(r'[^0-9]|[0-9]+', var)])
Run Code Online (Sandbox Code Playgroud)
比使用try/except更快.
@April在How is Pythons glob.glob ordered?中提供了一个很好的解决方案。你可以尝试
#First, get the files:
import glob
import re
files = glob.glob1(img_folder,'*'+output_image_format)
# Sort files according to the digits included in the filename
files = sorted(files, key=lambda x:float(re.findall("(\d+)",x)[0]))
Run Code Online (Sandbox Code Playgroud)
如果您key=在sort方法中使用cmp,则不应使用从最新版本的Python中删除的方法. key应该等同于一个函数,该函数将记录作为输入并返回将按照您希望列表排序的顺序进行比较的任何对象.它不需要是一个lambda函数,可能作为一个独立的函数更清晰.正则表达式的评估速度也很慢.
您可以尝试类似以下内容来隔离并返回文件名的整数部分:
def getint(name):
basename = name.partition('.')
alpha, num = basename.split('_')
return int(num)
tiffiles.sort(key=getint)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
22917 次 |
| 最近记录: |