如何下载特定cloudera发行版的源代码?

Chr*_*ord 1 hadoop hdfs cloudera

stackoverflow的同事们帮助我弄清楚了如何在ubuntu开发机器上确定特定的cloudera版本。(dpkg -l | grep cdh)。

现在,我想摸索这些资源,但是我不确定该去哪里下载它们。假设我要下载hdfs来源(带有适用于cdh5.3.0的cloudera mods):

dpkg显示的版本是:

hadoop-hdfs 2.5.0 + cdh5.3.0 + 781-1.cdh5.3.0.p0.54〜precise

现在,如果我转到此github存储库:https : //github.com/cloudera/hadoop-hdfs 我看不到任何包含字符串'5.3.0'的标签。

所以我被困在哪里看。任何指针将不胜感激。

Sac*_*inJ 6

您有两个选项可用于下载cloudera版本特定的源代码。

选项1:从Maven回购

https://repository.cloudera.com/artifactory/cloudera-repos/org/apache/hadoop/hadoop-hdfs/2.5.0-cdh5.3.0/hadoop-hdfs-2.5.0-cdh5.3.0-sources.jar

https://repository.cloudera.com/artifactory/cloudera-repos/org/apache/hadoop/hadoop-common/2.5.0-cdh5.3.0/hadoop-common-2.5.0-cdh5.3.0-sources.jar

(适当更改版本和hadoop组件名称)

选项2:从tar球回购

Cloudera以tar球(hadoop-xxxtar.gz)的形式提供Hadoop relases,它将同时包含二进制和源代码。在以下Cloudera存储库中可用。

http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.5.0-cdh5.3.0.tar.gz