我正在Hadoop 2.2.0运行单节点设置.
我的理解是,它hdfs dfs -ls很慢,因为它JVM每次被调用时都会旋转.
有没有办法让它保持JVM运行,这样简单的命令可以更快地完成?
我想告诉你我们为解决这个问题所做的解决方案.
我们创建了一个新的实用程序 - HDFS Shell,可以更快地处理HDFS.
https://github.com/avast/hdfs-shell
hdfs dfs -ls /,ls /- 两者都有效cd和pwd在 Pig grunt shell 命令中,fs -ls工作速度相当快,因此这可能是一个务实的解决方法。问题是,当尝试将输出通过管道传递给其他命令时,这不能很好地工作。
因此,我编写了一个脚本来启动pig grunt shell作为后台进程,并通过命名管道与其进行通信: https: //unix.stackexchange.com/a/144722/46085。问题是,即使我使用该script工具来伪造一个真正的终端(因为 grunt shell 期望如此),grunt shell 有时仍然会自杀。当用左右截断输出时,我也会遇到问题head,因为它仍然尝试写入整个输出,这反过来又会在命名管道中留下过时的输出。
无论如何,您可以看看它是否适合您。我很感激您可能发现的任何改进。
| 归档时间: |
|
| 查看次数: |
4761 次 |
| 最近记录: |