从Google财经获取超出API范围的财务数据

Mar*_*rco 5 python api google-finance data-mining

Google的财务API不完整 - 页面上的许多数字如下:

http://www.google.com/finance?fstype=ii&q=NYSE:GE

不能通过API获得.

我需要这些数据来根据Greenblatt的公式对加拿大证券交易所的公司进行排名,可通过谷歌搜索"greenblatt index scans"获得.

我的问题:在这些网页上访问和处理数据的最智能/最干净/最有效的方法是什么.在这种情况下,这种繁琐的方法是否真的是必要的,如果是这样,那么最好的方法是什么呢?我目前正在学习与此相关的项目的Python.

Rya*_*ght 4

您可以尝试要求 Google 提供缺少的 API。否则,您将陷入屏幕抓取的困境,这一点也不有趣,很容易在没有通知的情况下崩溃,并且可能违反 Google 的服务条款

但是,如果您仍然想编写屏幕抓取工具,那么很难击败mechanizeBeautifulSoup的组合。BeautifulSoup 是一个 HTML 解析器,而 mechanize 是一个基于 Python 的 Web 浏览器,可让您登录、存储 cookie 以及像任何其他 Web 浏览器一样进行导航。