我花了最近几天来掌握lxml的基础知识; 特别是使用lxml.html来解析网站并创建内容的ElementTree.理想情况下,我想保存返回的ElementTree,以便我可以加载它并进行实验,而不必在每次修改脚本时解析网站.我认为酸洗是要走的路,但我现在开始怀疑.虽然我可以在酸洗后检索ElementTree对象...
type(myObject)
Run Code Online (Sandbox Code Playgroud)
回报
<class 'lxml.etree._ElementTree'>
Run Code Online (Sandbox Code Playgroud)
对象本身似乎是"空的",因为我对它做的后续方法/属性调用都没有产生任何输出.
我的猜测是酸洗在这里不合适,但任何人都可以提出替代方案吗?
(如果重要的话,上面发生在:python3.2,lxml 2.3.2,snow-leopard))