相关疑难解决方法(0)

旅行/酒店API?

我正在开展一个大型项目,涉及创建一个包含地址,图像,描述,政策,坐标,设施,评论,当地区域描述及其设施等丰富数据的全球酒店数据库.

我正在寻找一个公共酒店API,我可以检索数据并运行(最好是RESTful)特定位置和可用房间的实时查询,然后我可以让我的客户进行预订.

任何人都可以分享这样一个项目的经验,知识和可能的指导方针,哪些API适用,哪些是最佳实践?

api

86
推荐指数
4
解决办法
13万
查看次数

使用Javascript抓取网站?

我正在努力将信息提交给严重依赖Javascript来完成其大部分操作的网站.当我在浏览器中禁用Javascript时,该网站甚至无法工作.

我在Google和SO上搜索了一些解决方案,并且有人建议我应该对Javascript进行逆向工程,但我不知道该怎么做.

到目前为止,我一直在使用Mechanize,它适用于不需要Javascript的网站.

有没有办法通过使用urllib2或类似的东西访问使用Javascript的网站?我也愿意学习Javascript,如果这就是它需要的东西.

javascript python screen-scraping

14
推荐指数
6
解决办法
2万
查看次数

urllib2返回浏览器的不同页面?

我正在尝试抓一个页面(我的路由器的管理页面),但该设备似乎正在为urllib2提供与我的浏览器不同的页面.以前有人发现过这个吗?我怎么能绕过它呢?

这个我正在使用的代码:

>>> from BeautifulSoup import BeautifulSoup
>>> import urllib2
>>> page = urllib2.urlopen("http://192.168.1.254/index.cgi?active_page=9133&active_page_str=page_bt_home&req_mode=0&mimic_button_field=btn_tab_goto:+9133..&request_id=36590071&button_value=9133")
>>> soup = BeautifulSoup(page)
>>> soup.prettify()
Run Code Online (Sandbox Code Playgroud)

(通过降价删除html输出)

python screen-scraping urllib2

2
推荐指数
1
解决办法
2439
查看次数

标签 统计

python ×2

screen-scraping ×2

api ×1

javascript ×1

urllib2 ×1