你如何使用python 2.6删除包括的所有内容 <div class="comment"> ....remove all ....</div>
我尝试了各种方式使用re.sub没有任何成功
谢谢
这是表
CREATE TABLE IF NOT EXISTS kompas_url
(
id BIGINT(20) NOT NULL AUTO_INCREMENT,
url VARCHAR(1000),
created_date datetime,
modified_date datetime,
PRIMARY KEY(id)
)
Run Code Online (Sandbox Code Playgroud)
我只是在url不存在的情况下尝试INSERT到kompas_url表
任何的想法?
谢谢
我试图提取具有特定文本文件的文本:
----
data1
data1
data1
extractme
----
data2
data2
data2
----
data3
data3
extractme
----
Run Code Online (Sandbox Code Playgroud)
然后将其转储到文本文件中
----
data1
data1
data1
extractme
---
data3
data3
extractme
---
Run Code Online (Sandbox Code Playgroud)
谢谢您的帮助.
我想删除
[<span class="street-address">
510 E Airline Way
</span>]
Run Code Online (Sandbox Code Playgroud)
我已经使用这个清洁功能来删除它们之间的那个 < >
def clean(val):
if type(val) is not StringType: val = str(val)
val = re.sub(r'<.*?>', '',val)
val = re.sub("\s+" , " ", val)
return val.strip()
Run Code Online (Sandbox Code Playgroud)
它产生了 [ 510 E Airline Way ]
我试图内"干净"的功能添加到删除字符'['和']',基本上我只是想要得到的"510 E Airline Way".
任何人都有任何线索我可以添加什么clean功能?
谢谢