Eya*_*alk 4 amazon-s3 google-cloud-storage google-bigquery
我在Google App Engine上部署了一个python Web应用程序.
我需要获取存储在Amazon S3上的日志文件并将其加载到Google Cloud Storage中.一旦进入Google云端存储,我可能需要执行一些转换,最终将数据导入BigQuery进行分析.
我尝试使用gsutil作为某种概念证明,因为boto是在gsutil的引擎盖下,我想在我的项目中使用boto.这没用.
我想知道是否有人设法直接在2个云之间传输文件.如果可能的话,我想看一个简单的例子.最后,这个任务必须通过在GAE上执行的代码来完成.
根据此主题,您可以使用gsutil将数据从S3流式传输到Google云端存储,但每个字节仍需要两次跳转:S3到您的本地计算机,然后您的计算机到GCS.但是,由于您正在使用App Engine,因此您应该能够从S3中提取并存入GCS.除了App Engine是中介之外,它与上面的进展相同,即每个字节从S3传输到您的应用程序,然后传输到GCS.您可以使用boto作为推送端,使用Google Cloud Storage API作为推送端.
| 归档时间: |
|
| 查看次数: |
1513 次 |
| 最近记录: |