Python HTML解析

Joh*_*ard 0 html python html-parsing python-3.x

我目前正在尝试创建一个程序,给出一个单词将查找其定义并返回它.虽然我已经开始使用它,但我不得不求助于使用RegEx来搜索存储定义的标记之间的文本.使用python 3.x执行此操作的更有效方法是什么?

Len*_*bro 5

lxml适用于Python 3.它有一个ElementTree兼容的API,但是在幕后使用c库,所以它很快,它支持Xpath,这是一种很好的解析方式(有时候).