我有一个关于文件写入和HDFS读取的基本问题.
例如,如果我使用默认配置编写文件,Hadoop内部必须将每个块写入3个数据节点.我的理解是,对于每个块,首先客户端将块写入管道中的第一个数据节点,然后通知第二个,依此类推.一旦第三个数据节点成功接收到块,它就会向数据节点2提供确认,最后通过数据节点1向客户端提供确认.只有在收到块的确认后,才认为写入成功,客户端继续写入下一个街区.
如果是这种情况,那么编写每个块所花费的时间不会超过传统的文件写入,因为 -
如果我的理解错了,请纠正我.另外,以下问题如下:
| 归档时间: |
|
| 查看次数: |
5653 次 |
| 最近记录: |