我点击了流式数据,例如引荐网址,热门目标网页,热门退出页面以及Google Analytics中的网页浏览量,访问次数和退回度等指标.目前还没有数据库可以存储所有这些信息.我需要从这个数据中建立一个从头开始的数据仓库(我相信这就是所谓的web-house).所以我需要从Google Analytics中提取数据并将其加载到仓库中,每天自动化.我的问题是: -
1)有可能吗?每天数据增加(有些指标或措施,如访问量和一些新的推荐网站),加载仓库的过程如何?
2)什么ETL工具可以帮助我实现这一目标?Pentaho我相信有一种方法可以从Google Analytics中提取数据,是否有人使用它?这个过程怎么样?除了答案之外,任何参考,链接都将受到赞赏