小编use*_*422的帖子

是否有正式的 Apache Parquet 规范?

我正在了解 Parquet 文件格式,但似乎没有正式的规范。例如,元数据的布局是什么?我看到的是很多代码实现。任何帮助,将不胜感激。谢谢,马克

specifications parquet

8
推荐指数
1
解决办法
1798
查看次数

Azure Data Lake商店基准

对于开发人员,

我正在为Azure Data Lake做基准测试,在同一区域中,读取ADL存储和写入VHD的速度大约为7.5 MB / S。PowerShell和C#就是这种情况,其代码摘自以下示例:

PowerShell代码来自https://azure.microsoft.com/zh-cn/documentation/articles/data-lake-store-get-started-powershell/ C#代码来自https://azure.microsoft.com/zh-我们/文档/文章/ data-lake-store-get-started-net-sdk /

以上代码示例是否可用于基准测试,还是将交付新的SDK以提高吞吐量?另外,当ADL Store普遍可用时,是否有预期的吞吐量数字?

谢谢,马克

c# powershell azure azure-data-lake cortana-intelligence

5
推荐指数
1
解决办法
835
查看次数

从快照创建 AWS EBS 卷的完整副本

对于开发人员来说,当我从快照创建 EBS 卷并将其附加到 EC2 节点时,我会遇到延迟读取。
我想创建一个具有完整副本的EBS卷,以便第一次读取不慢。
有没有办法做到这一点?谢谢,马克

snapshot amazon-web-services

2
推荐指数
1
解决办法
528
查看次数