Dav*_*542 18 google-bigquery google-cloud-platform
我们发现BigQuery可以很好地处理大于100M行的数据集,其中"初始化时间"并没有真正生效(或者与查询的其余部分相比可以忽略不计).
但是,在任何情况下,性能都很慢而且很差,这使得它(1)不适合在交互式BI工具中工作; (2)不如其他产品,如Redshift甚至ElasticSearch,其数据大小在100M以下.实际上,我们组织的一名工程师正在评估一项技术,该技术用于对具有大约1000名用户的分析产品进行1M到100M行数据大小的查询,他的反馈是他无法相信BigQuery的速度有多慢.
如果没有对BigQuery产品的辩护,我想知道是否有任何改进计划:
Ell*_*ard 12
花在元数据/启动上的时间,但实际执行时间非常短.我们正在进行的工作将解决这个问题,但有些变化很复杂,需要一段时间.
您可以想象,在其初期阶段,BigQuery可以拥有用于管理作业,元数据等的中央系统,其方式对于使用该服务的所有N 0实体执行得非常好.然而,一旦你到达N 1个实体,可能有必要重新构造一些东西,使它们具有尽可能小的延迟.有关新功能的通知 - 这也是我们宣布与启动延迟相关的API改进的地方 - 请关注我们的发行说明,您也可以将其订阅为RSS源.
| 归档时间: |
|
| 查看次数: |
2203 次 |
| 最近记录: |