使用Mechanize进行ASPX抓取:无法检索表单?

Ric*_*ard 1 python screen-scraping mechanize web-scraping

我正在尝试使用Python Mechanize 抓取.aspx网页.但ParseError: unexpected '[' char in declaration即使我手动删除DTD,我仍然会收到一个有趣的错误.

这是我的完整代码:

url = 'http://corporate.marksandspencer.com/aboutus/where/international_stores'
browser = mechanize.Browser()
browser.open(url)
browser.select_form(nr=0)
Run Code Online (Sandbox Code Playgroud)

ParseError: unexpected '[' char in declaration在最后一行失败了.任何人都可以建议可能出错的地方?

小智 6

我也有类似的问题.我在开始时添加了以下行,它对我有用.

self.browser = mechanize.Browser(factory=mechanize.RobustFactory()) 
Run Code Online (Sandbox Code Playgroud)