小编Mic*_*Lee的帖子

python删除<div class ="comment> .. any ... </ div>之间的所有内容

你如何使用python 2.6删除包括的所有内容 <div class="comment"> ....remove all ....</div>

我尝试了各种方式使用re.sub没有任何成功

谢谢

html python class

9
推荐指数
2
解决办法
5801
查看次数

Python mysql在插入之前检查重复

这是表

CREATE TABLE IF NOT EXISTS kompas_url
(
    id  BIGINT(20) NOT NULL AUTO_INCREMENT,
    url VARCHAR(1000),
    created_date datetime,
    modified_date datetime,
    PRIMARY KEY(id)
)
Run Code Online (Sandbox Code Playgroud)

我只是在url不存在的情况下尝试INSERT到kompas_url表

任何的想法?

谢谢

python mysql insert no-duplicates

3
推荐指数
1
解决办法
6277
查看次数

Python从文件中提取数据

我试图提取具有特定文本文件的文本:

----
data1
data1
data1
extractme
----
data2
data2
data2
----
data3
data3
extractme
----
Run Code Online (Sandbox Code Playgroud)

然后将其转储到文本文件中

----
data1
data1
data1
extractme
---
data3
data3
extractme
---
Run Code Online (Sandbox Code Playgroud)

谢谢您的帮助.

python file-io

1
推荐指数
2
解决办法
4万
查看次数

Python beautifulsoup试图删除html标签'span'

我想删除

[<span class="street-address">
            510 E Airline Way
           </span>]
Run Code Online (Sandbox Code Playgroud)

我已经使用这个清洁功能来删除它们之间的那个 < >

def clean(val):
 if type(val) is not StringType: val = str(val)
 val = re.sub(r'<.*?>', '',val) 
 val = re.sub("\s+" , " ", val)
 return val.strip()
Run Code Online (Sandbox Code Playgroud)

它产生了 [ 510 E Airline Way ]

我试图内"干净"的功能添加到删除字符'['']',基本上我只是想要得到的"510 E Airline Way".

任何人都有任何线索我可以添加什么clean功能?

谢谢

python regex beautifulsoup

0
推荐指数
1
解决办法
3675
查看次数

标签 统计

python ×4

beautifulsoup ×1

class ×1

file-io ×1

html ×1

insert ×1

mysql ×1

no-duplicates ×1

regex ×1