相关疑难解决方法(0)

从Python中的字符串中删除HTML

from mechanize import Browser
br = Browser()
br.open('http://somewebpage')
html = br.response().readlines()
for line in html:
  print line
Run Code Online (Sandbox Code Playgroud)

在HTML文件中打印一行时,我试图找到一种方法来只显示每个HTML元素的内容而不是格式本身.如果找到'<a href="whatever.com">some text</a>',它只会打印"一些文字",'<b>hello</b>'打印"你好"等等.怎么会这样做呢?

html python

254
推荐指数
11
解决办法
22万
查看次数

在Python中清理HTML

我正在汇总来自少数外部资源的内容,并发现其中一些内容包含HTML/DOM中的错误.一个很好的例子是HTML缺少结束标记或格式错误的标记属性.有没有办法清除本机中的错误或我可以安装的任何第三方模块?

html python django

15
推荐指数
2
解决办法
1万
查看次数

标签 统计

html ×2

python ×2

django ×1