小编lor*_*zov的帖子

如何在python中解析格式错误的HTML

我需要浏览解析的HTML文档的DOM树.

我在使用lxml解析字符串之前使用的是uTidyLib

a = tidy.parseString(html_code,options)dom = etree.fromstring(str(a))

有时我得到一个错误,似乎tidylib无法修复格式错误的HTML.

如何在不出错的情况下解析每个HTML文件(仅解析一些无法修复的文件部分)？

html python lxml

lor*_*zov

lucky-day

15
推荐指数

2
解决办法

7264
查看次数

Django管理员使用FCGI + lighttpd

我在lighttpd + FCGI上运行django安装.一切正常,除了管理员.

似乎在我发布某些内容后重定向(即我修改了sor创建模型的实例)出错了.

管理员会将我重定向到www.xyz.com/django.fcgi/admin/...而django.fcgi只能由lighttp重写规则使用来调用FCGI.

这是conf文件中的重定向

url.rewrite-once = (
                "^(/media.*)$" => "$1",
                "^/favicon\.ico$" => "/media/favicon.ico",
                    "^(/.*)$" => "/django.fcgi$1",
)

Run Code Online (Sandbox Code Playgroud)

我怎样才能解决这个问题？

django fastcgi lighttpd

lor*_*zov

lucky-day

3
推荐指数

1
解决办法

759
查看次数

标签统计

django ×1

fastcgi ×1

html ×1

lighttpd ×1

lxml ×1

python ×1

如何在python中解析格式错误的HTML

Django管理员使用FCGI + lighttpd

标签 统计

小编lor_zov的帖子

标签统计