小编D78*_*rul的帖子

Spark RDD 和 HDFS 数据块的区别

请帮助我理解 HDFS 的数据块和 Spark 中的 RDD 之间的区别。HDFS 将数据集分发到集群中的多个节点，因为具有相同大小的块和数据块将被多次复制并存储。RDD 被创建为并行化集合。Parallelized 集合的元素是跨节点分布还是存储在内存中进行处理？与 HDFS 的数据块有任何关系吗？

hadoop hdfs apache-spark rdd

D78*_*rul

2018 02-01

1
推荐指数

1
解决办法

2614
查看次数

标签统计

apache-spark ×1

hadoop ×1

hdfs ×1

rdd ×1

Spark RDD 和 HDFS 数据块的区别

标签 统计

小编D78_rul的帖子

标签统计