Bla*_*ord 2 python regex python-3.x
我想重命名一长串文件名,以使它们更易于搜索.自动生成的名称,因此存在一些奇怪的间距问题.我写了一个小蟒蛇脚本来做我想要的.但我不想删除单词之间的空格.例如,我有两个名字:
0 130 — HG — 1500 — 12" (Page 1 of 2)
01 30 — HD LOW POINT DRAIN
Run Code Online (Sandbox Code Playgroud)
他们应该读:
0130-HG-1500-12"
0130-HD LOW POINT DRAIN
Run Code Online (Sandbox Code Playgroud)
我的代码到目前为止:
import os
import re
for filename in os.listdir("."):
if not filename.endswith(".py"):
os.replace(filename, re.sub("[(].*?[)]", "", # Remove anything between ()
"".join(filename.split() # Remove any whitespaces
).replace("—", "-"))) # Replace Em dash with hyphen
Run Code Online (Sandbox Code Playgroud)
一切都在工作,除了我无法弄清楚如何不在单词之间剥离白色空格.
如果用"单词"表示"由字母组成的字符串"那么
re.sub('((?<=[^a-zA-Z]) | (?=[^a-zA-Z]))', '', filename)
Run Code Online (Sandbox Code Playgroud)
会做的.用简单的语言来说,这将"替换任何非字母字符之后或之前的所有空格".输出:
In [24]: re.sub('((?<=[^A-Z]) | (?=[^A-Z]))', '', '01 30 — HD LOW POINT DRAIN ')
Out[24]: '0130—HD LOW POINT DRAIN'
In [25]: re.sub('((?<=[^A-Z]) | (?=[^A-Z]))', '', '0 130 — HG — 1500 — 12"')
Out[25]: '0130—HG—1500—12"'
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
646 次 |
| 最近记录: |