小编lor*_*zov的帖子

如何在python中解析格式错误的HTML

我需要浏览解析的HTML文档的DOM树.

我在使用lxml解析字符串之前使用的是uTidyLib

a = tidy.parseString(html_code,options)dom = etree.fromstring(str(a))

有时我得到一个错误,似乎tidylib无法修复格式错误的HTML.

如何在不出错的情况下解析每个HTML文件(仅解析一些无法修复的文件部分)?

html python lxml

15
推荐指数
2
解决办法
7264
查看次数

Django管理员使用FCGI + lighttpd

我在lighttpd + FCGI上运行django安装.一切正常,除了管理员.

似乎在我发布某些内容后重定向(即我修改了sor创建模型的实例)出错了.

管理员会将我重定向到www.xyz.com/django.fcgi/admin/...而django.fcgi只能由lighttp重写规则使用来调用FCGI.

这是conf文件中的重定向

url.rewrite-once = (
                "^(/media.*)$" => "$1",
                "^/favicon\.ico$" => "/media/favicon.ico",
                    "^(/.*)$" => "/django.fcgi$1",
)
Run Code Online (Sandbox Code Playgroud)

我怎样才能解决这个问题?

django fastcgi lighttpd

3
推荐指数
1
解决办法
759
查看次数

标签 统计

django ×1

fastcgi ×1

html ×1

lighttpd ×1

lxml ×1

python ×1