小编Pra*_*mit的帖子

为什么没有'hadoop fs -head'hell命令?

在HDFS上检查文件的快速方法是使用tail:

~$ hadoop fs -tail /path/to/file
Run Code Online (Sandbox Code Playgroud)

这将显示文件中的最后一千字节数据,这非常有用.但是,相反的命令head似乎不是shell命令集合的一部分.我发现这非常令人惊讶.

我的假设是,由于HDFS是为非常大的文件上的非常快速的流读取而构建的,因此存在一些影响访问的问题head.这让我对做头脑的事情犹豫不决.有人有答案吗?

hadoop hdfs

57
推荐指数
2
解决办法
4万
查看次数

将 NLP 转换为 SQL 的方法有哪些?

最近,开始研究对话聊天机器人的想法,并一直在思考将自然语言查询转换为 SQL 的不同方法。这些是我在从头开始编写之前要评估的一些库。任何其他想法或建议?

nlp machine-learning

6
推荐指数
1
解决办法
6972
查看次数

EMR hadoop 的 Maven 存储库

AWS EMR 是否有自己的 EMR Hadoop/Spark/Others 的 maven 存储库,类似于

  1. HDP [ http://repo.hortonworks.com/content/repositories/releases/ ]
  2. CDH [ https://repository.cloudera.com/artifactory/cloudera-repos ]

问题:

  • 如果有,它的网址是什么?

  • 如果情况并非如此,社区建议如何构建要在 EMR 实例上执行的 Spark jar?

提前致谢。

amazon hadoop amazon-web-services emr

4
推荐指数
1
解决办法
2532
查看次数

标签 统计

hadoop ×2

amazon ×1

amazon-web-services ×1

emr ×1

hdfs ×1

machine-learning ×1

nlp ×1