小编dae*_*n12的帖子

是否有hdfs命令按时间戳列出HDFS目录中的文件

是否有hdfs命令按时间戳,升序或降序列出HDFS目录中的文件?默认情况下,hdfs dfs -lscommand提供未排序的文件列表.

当我搜索答案时,我得到的是一种解决方法,即hdfs dfs -ls /tmp | sort -k6,7.但有没有更好的方法,内置hdfs dfs命令行?

hadoop hdfs

22
推荐指数
1
解决办法
7万
查看次数

Apache Apex与Apache Storm有何不同?

Apache Apex看起来与Apache Storm类似.

  • 用户在两个平台上构建应用程序/拓扑作为定向非循环图(DAG).Apex使用运营商/流,Storm使用spouts/streams/bolt.
  • 它们都是实时处理数据而不是批处理.
  • 两者似乎都具有高吞吐量和低延迟

因此,一目了然,两者看起来都很相似,但我并没有完全发挥作用.有人可以解释一下有哪些主要区别?换句话说,我何时应该使用一个而不是另一个?

stream-processing bigdata apache-storm apache-apex

9
推荐指数
1
解决办法
1240
查看次数

几个蜂巢面试问题

我最近在接受一家公司的采访时遇到了一些问题。由于我是Hadoop的新手,所以有人可以告诉我正确的答案吗?

问题:

  1. Hive中“排序依据”和“分组依据”之间的区别。他们如何工作?
  2. 如果我们在Hive中的任何SQL查询中使用“限制1”,那么Reducer是否可以工作。
  3. 如何优化蜂巢性能?
  4. “内部表”和“外部表”之间的区别
  5. Hive和SQL之间的主要区别是什么

请提供一些有用的资源,以便我可以更好地学习。谢谢

hadoop hive hadoop-streaming hiveql hadoop2

1
推荐指数
1
解决办法
9192
查看次数