MSt*_*odd 2 python google-app-engine xpath mechanize beautifulsoup
我目前有一些Ruby代码用来刮一些网站.我当时正在使用Ruby,因为当时我正在使用Ruby on Rails创建一个站点,这只是有意义的.
现在我正试图将其移植到Google App Engine,并继续陷入困境.
我已将Python Mechanize移植到与Google App Engine一起使用,但它不支持使用XPATH进行DOM检查.
我已经尝试了内置的ElementTree,但是当它遇到'&mdash'时,我在第一个HTML blob上窒息了.
我是否一直试图在那里破解ElementTree,或者我是否尝试使用其他东西?
谢谢,马克
小智 6
lxml - 比elementtree好100倍
归档时间: |
|
查看次数: |
1938 次 |
最近记录: |