我知道我们可以设置属性"mapred.job.reuse.jvm.num.tasks"来重用JVM.我的问题是:
(1)如何确定这里要设置的任务数,-1还是其他一些正整数?
(2)在mapreduce作业中已经重用JVM并将此属性设置为-1是一个好主意吗?
非常感谢你!
performance hadoop jvm mapreduce
我有一个要写入HBase的Put操作列表.我在HTable类中发现了两个可能的API调用
batch(List)和put(List).
我想知道这两个函数在写性能方面有什么区别?
hbase
hadoop ×1
hbase ×1
jvm ×1
mapreduce ×1
performance ×1