小编Div*_*vya的帖子

BeautifulSoup python解析html文件

我使用BeautifulSoup替换html文件中的所有逗号‚.这是我的代码:

f = open(sys.argv[1],"r")
data = f.read()

soup = BeautifulSoup(data)

comma = re.compile(',') 


for t in soup.findAll(text=comma):
        t.replaceWith(t.replace(',', '‚'))
Run Code Online (Sandbox Code Playgroud)

此代码有效,除非html文件中包含一些javascript.在这种情况下,它甚至用javascript代码替换逗号(,).这不是必需的.我只想替换html文件的所有文本内容.

python beautifulsoup

0
推荐指数
1
解决办法
4154
查看次数

标签 统计

beautifulsoup ×1

python ×1