我正在使用Hadoop开发一个项目,它似乎本身就包含了Java并为Python提供了流媒体支持.选择一个而不是另一个会对性能产生重大影响吗?在这个过程中,如果某种方式存在显着的性能差异,我可以采用任何一种方式.
python java hadoop
Hadoop Streaming作业和常规Java作业之间有什么区别?与后者相比,使用Hadoop流媒体有什么优势?
还有一件事,我正在使用mapreduce API(即新API),并且听说流仅适用于已弃用的mapred API。是吗 ?
java hadoop mapreduce
hadoop ×2
java ×2
mapreduce ×1
python ×1