实际上我正在尝试与R集成我的级别,但是我收到了这个错误.
包'rmr','rJava','RJSONIO','rhdfs','rhbase','plyrmr'不可用(对于R版本3.1.3)
将Hadoop与R集成的步骤:
在Ubuntu中安装了R和Hadoop.
在〜/ .bashrc文件中添加这三行.
*export HADOOP_PREFIX =/Users/hadoop/hadoop-1.1.2
export HADOOP_CMD =/Users/hadoop/hadoop-1.1.2/bin/hadoop
export HADOOP_STREAMING =/Users/hadoop/hadoop-1.1.2/contrib/streaming/hadoop-streaming-1.1.2.jar*
使用此命令安装R软件包
install.packages(c("rJava", "RJSONIO", "rmr", "rhdfs", "rhbase", "plyrmr").
Run Code Online (Sandbox Code Playgroud)
但我得到了上述错误.如何集成R和Hadoop的主要问题是什么?我已按照此链接进行整合.
小智 9
从https://github.com/RevolutionAnalytics/RHadoop/wiki下载rhdfs,rhbase,rmr2和plyrmr软件包,并按如下方式安装:
install.packages("<path>/rhdfs_1.0.8.tar.gz", repos=NULL, type="source")
install.packages("<path>/rmr2_2.2.2.tar.gz", repos=NULL, type="source")
install.packages("<path>plyrmr_0.2.0.tar.gz", repos=NULL, type="source")
install.packages("<path>/rhbase_1.2.0.tar.gz", repos=NULL, type="source")
Run Code Online (Sandbox Code Playgroud)
您可以尝试通过指定存储库来安装这些软件包吗:
install.packages(c("rJava", "RJSONIO", "rmr", "rhdfs", "rhbase", "plyrmr"), repos="http://cran.r-project.org/")
Run Code Online (Sandbox Code Playgroud)