我正在尝试处理一堆文件,然后我需要改变以删除文件名中的无关信息; 值得注意的是,我正在尝试删除括号内的文本.例如:
filename = "Example_file_(extra_descriptor).ext"
Run Code Online (Sandbox Code Playgroud)
我希望正则表达一大堆文件,其中括号表达式可能在中间或末尾,并且可变长度.
正则表达式是什么样的?Perl或Python语法将是首选.
我使用了下面的代码
input_table = input_table.replace(to_replace='(', value="")
Run Code Online (Sandbox Code Playgroud)
替换整个数据框中的括号。但令我惊讶的是,它不起作用。可能出了什么问题?
我想删除[]当前我正在做的字符之间的字符
df['Text'] = df['Text'].str.replace(r"\[.*\]","")
Run Code Online (Sandbox Code Playgroud)
但输出并不理想。之前,它是[image] This document,它是经过******* This document地方*是空白。
我如何摆脱这个空白。
编辑 1
该Text列df看上去象下面这样:
ID Text
0 REAL ESTATE LEASE THIS INDUSTRIAL REAL ESTAT...
5 Lease AureementMade and signed on the \ of Aug...
6 FIRST AMENDMENT OF LEASEDATE: August 31, 2001L...
8 [image: image0.jpg] Jack[image: image1.jb2] ...
9 [image: image0.jpg] ABC SALES Meeting 97...
14 FIRST AMENDMENT OF LEASETHIS FIRST AMENDMENT O...
17 [image: image0.tif] Deep ML LEASE …Run Code Online (Sandbox Code Playgroud)