在Windows 7计算机上有没有一个很好的Hadoop开发在线教程?

Ste*_*eph 9 windows hadoop windows-7

我一直关注着令人敬畏的雅虎!Hadoop教程,非常适合设置虚拟机环境(本教程的第3单元).但是现在我被HDFS部分(模块2)难倒了,并且认为如果我有一个特定于Windows的教程可能会更容易.我尝试过这个,但有些步骤并不完全正确.我一直在努力寻找一个适合我在Windows 7机器上运行的好教程,但我有点卡住了.有一个好去处吗?Hadoop似乎非常适合Linux用户,不幸的是我必须使用我的工作笔记本电脑,这是Windows 7.我可以做这项工作还是真的只适用于Linux用户?

All*_*len 7

雅虎开发者网络上的Hadoop教程已经过时且存在问题.一半的步骤对我来说根本不起作用(我在Windows 7上运行VMware Player中的图像),而另一半则模糊不清.Java代码示例编写得很糟糕,无法编译.无论如何,它们都是为旧的Hadoop API编写的.

我放弃了该教程,而是使用了Cloudera Demo VM映像.这预先配置了Hadoop,Pig,Hive,HBase等.我立即开始营业,并且在编译和运行Hadoop作业和Pig脚本方面没有任何问题.

Cloudera Demo VM在其主要支持页面上下载(https://ccp.cloudera.com/display/SUPPORT/Cloudera的+ Hadoop + Demo + VM)均为64位.如果你正在寻找像我一样的32位版本,你可以在这里找到一个:https://downloads.cloudera.com/cloudera-demo-0.3.7.vmwarevm.tar.bz2

这个有一个稍微旧版本的Cloudera发行版(CDH3u0)在Ubuntu 10.10和Gnome桌面上运行.我安装了Eclipse来编译我的Hadoop作业,但没有尝试安装Hadoop插件,我听说这是有问题的.第一次,我错误地通过系统的Update Manager将Cloudera发行版更新到CDH3u3,这搞砸了我的Hadoop配置.我不知道如何正确地重新配置它,所以我刚从原始图像开始.

要让Pig运行,您需要先设置JAVA_HOME变量: export JAVA_HOME=/usr/lib/jvm/java-6-sun

不幸的是,在熟悉Hadoop的Java开发人员朋友向我指出Cloudera发行版之前,我浪费了大量的时间来使用旧的YDN教程.