RDBMS VS MAP REDUCE

Cod*_*per 2 hadoop mapreduce

我正在浏览Hadoop-权威指南,我遇到了这些问题:

规范化给MapReduce带来了问题,因为它使得读取记录成为非本地操作,而MapReduce的一个主要假设是可以执行(高速)流读取和写入.

有人可以解释这些线条在外行语言中的实际含义吗?

我知道什么是规范化.它是如何使读取记录成为非本地操作的?参考hadoop的非本地操作是什么意思?

Mik*_*ike 5

在hadoop中,本地操作指的是在存储其需要使用的数据的相同物理位置中执行代码.

当您对数据进行标准化时,您实际上是将其拆分.如果这个"拆分"数据分布在2个物理上不同的区域,则突然发生非本地操作.