我的目标是学习猪,以增强我的机器学习/统计分析工作的简历.我现在并不是真的对所有细节Hadoop的细节感兴趣(虽然我很想在以后学习它们 - 即使有说明,在我的机器上设置也很困难,我更像是一个统计数据而不是一个程序员).是否有一些资源我可以学习猪,并且可以轻松访问它进行实验,而无需从头开始学习Hadoop?
是.安装猪,然后在本地运行.它可以在本地做任何事情(尽管在大多数情况下更慢),它可以做到超过hadoop.
对于交互式shell(grunt):
pig -x local
Run Code Online (Sandbox Code Playgroud)
要在本地运行pig脚本:
pig -x local some_script.pig
Run Code Online (Sandbox Code Playgroud)
关于如何使用猪的最好的文档已经在Apache上完成了,他们也有一个非常好的教程.
| 归档时间: |
|
| 查看次数: |
3593 次 |
| 最近记录: |