使用替代BLAS for R有几个优点,例如https://cran.r-project.org/web/packages/gcbd/vignettes/gcbd.pdf.
Microsoft R Open https://mran.revolutionanalytics.com/documents/rro/installation/#sysreq使用Intel的MKL而不是默认的Reference BLAS来加速计算.
我的问题是:
将英特尔的MKL库**手动链接到R**在Windows上的最新版本(https://cran.r-project.org/bin/windows/base/)的确切步骤是什么?
更新20-07-2016: 这里有关于如何为R≥3.3.0的Windows 64位R构建基于OpenBLAS的Rblas.dll的详细说明:http://www.avrahamadler.com/r-tips /集结openblas换窗户-R64 /
在尝试安装包"RevoScaleR"时,我收到以下错误.我尝试使用各种版本的R安装此软件包,但每次都会出现相同的错误.有谁知道为什么?
install.packages("RevoScaleR")
Run Code Online (Sandbox Code Playgroud)
install.packages中的警告:包"RevoScaleR"不可用(对于R版本3.1.2)
任何帮助表示赞赏.
更新(2014年8月):我从来没有深究这一点,也从未得到过有关Revolution论坛的任何反馈.然而,这个问题似乎已在Revolution R 7.2中得到修复(使用R 3.0.3,再次是学术版).我运行lme()测试几百次,所有产生的结果都是预期的.[ 更新结束 ]
我刚刚在一台新PC上安装了Revolution R 7.0(R 3.0.2)的学术版本,并且下面的代码得到了奇怪的结果.每次运行代码时,它都会产生不同的结果.在CRAN-R下,结果总是一样的(我认为应该是这样).代码片段来自test.data.table()
版本1.8.10的测试527 ,它指出了错误.
library(nlme)
all.equal(lme(distance ~ age, data=Orthodont), lme(distance ~ age, data=Orthodont))
Run Code Online (Sandbox Code Playgroud)
我得到类似下面的东西,但每次都不一样.
> all.equal(lme(distance ~ age, data=Orthodont), lme(distance ~ age, data=Orthodont))
[1] "Component 4: Component 2: Component 1: Mean relative difference: 1.774149e-08"
[2] "Component 7: Mean relative difference: 0.0003335902"
Run Code Online (Sandbox Code Playgroud)
'有趣'的事情是nlme
包(其中lme()
一部分)本身是相同的,我卸载并重新安装以确保(包的nlme_3.1-113.zip文件是逐位相同的).
我还不知道还有什么可以深入人心的.任何指针或想法将不胜感激.我也在Revolutions的论坛上发帖,但它似乎比这里少得多......
这是64位Windows 8.1,64位R,如果重要的话,Intel i7-4770 CPU.当前版本的Revolution R(R 3.0.2)和之前的版本(2.15.3)都会产生意想不到的(对我而言)行为.CRAN-R 3.0.1和3.0.2产生相同的结果.
Revolution R的sessionInfo()输出:
> sessionInfo()
R version 3.0.2 (2013-09-25)
Platform: x86_64-w64-mingw32/x64 (64-bit)
locale:
[1] LC_COLLATE=English_United States.1252
[2] …
Run Code Online (Sandbox Code Playgroud) 当我尝试使用devtools从git-hub下载并安装软件包时,我遇到了这个问题.
R版本:3.1.3(64位)
> install_github("hadley/httr")
Downloading github repo hadley/httr@master
Error in curl::curl_fetch_memory(url, handle = handle) :
Timeout was reached
> traceback()
13: .Call(R_curl_fetch_memory, url, handle)
12: curl::curl_fetch_memory(url, handle = handle)
11: request_fetch.write_memory(req$output, req$url, handle)
10: request_fetch(req$output, req$url, handle)
9: request_perform(req, hu$handle$handle)
8: httr::HEAD(src_submodules, , auth)
7: github_has_remotes(x, auth)
6: remote_download.github_remote(remote, quiet = quiet)
5: remote_download(remote, quiet = quiet)
4: FUN(X[[1L]], ...)
3: vapply(remotes, install_remote, ..., FUN.VALUE = logical(1))
2: install_remotes(remotes, ...)
1: install_github("hadley/httr")
Run Code Online (Sandbox Code Playgroud)
编辑:
我正在使用Revolution R Enterprise 7.4和Rstudio客户端.
所以我安装了旧版本的ggplot2
与install_version
从devtools
(0.9.1或东西),看看它是如何工作-在以前安装的版本2.0.0的方式.然后我升级了版本,它令人惊讶地给了我1.0.0版本,而不是当前的2.0.0版本.
现在,当我做一个时,install.packages("ggplot2")
我得到相同的1.0.0.还Check for package upgrades..
从Rstudio菜单中选择" "项目,它告诉我"所有包都是最新的".
是什么赋予了?是不是ggplot
现在2.0.0 的最新版本?这是我的会话信息:
R version 3.2.2 (2015-08-14)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 8 x64 (build 9200)
locale:
[1] LC_COLLATE=English_United States.1252 LC_CTYPE=English_United States.1252
[3] LC_MONETARY=English_United States.1252 LC_NUMERIC=C
[5] LC_TIME=English_United States.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] devtools_1.9.1 ggplot2_1.0.0 dplyr_0.4.3 shiny_0.12.2 RevoUtils_7.5.0
loaded via a namespace (and not attached):
[1] Rcpp_0.12.2 magrittr_1.5 MASS_7.3-43 munsell_0.4.2 colorspace_1.2-6 …
Run Code Online (Sandbox Code Playgroud) 我试图在单节点Hadoop集群中使用rmr2运行一个简单的MR程序.这是设置的环境
Ubuntu 12.04(32位)
R(Ubuntu附带2.14.1,因此更新到3.0.2)
从这里安装了最新的rmr2和rhdfs 以及相应的依赖项
Hadoop 1.2.1
现在我正在尝试运行一个简单的MR程序
Sys.setenv(HADOOP_HOME="/home/training/Installations/hadoop-1.2.1")
Sys.setenv(HADOOP_CMD="/home/training/Installations/hadoop-1.2.1/bin/hadoop")
library(rmr2)
library(rhdfs)
ints = to.dfs(1:100)
calc = mapreduce(input = ints, map = function(k, v) cbind(v, 2*v))
from.dfs(calc)
Run Code Online (Sandbox Code Playgroud)
mapreduce作业失败,并在hadoop-1.2.1/logs/userlogs/job_201310091055_0001/attempt_201310091055_0001_m_000000_0/stderr中显示以下错误消息
Error in library(functional) : there is no package called ‘functional’
Execution halted
java.lang.RuntimeException: PipeMapRed.waitOutputThreads(): subprocess failed with code 1
at org.apache.hadoop.streaming.PipeMapRed.waitOutputThreads(PipeMapRed.java:362)
at org.apache.hadoop.streaming.PipeMapRed.mapRedFinished(PipeMapRed.java:576)
Run Code Online (Sandbox Code Playgroud)
但是,sessionInfo()
显示功能包已加载
> sessionInfo()
R version 3.0.2 (2013-09-25)
Platform: i686-pc-linux-gnu (32-bit)
>locale:
[1] LC_CTYPE=en_IN LC_NUMERIC=C LC_TIME=en_IN
[4] LC_COLLATE=en_IN LC_MONETARY=en_IN LC_MESSAGES=en_IN
[7] LC_PAPER=en_IN LC_NAME=C …
Run Code Online (Sandbox Code Playgroud) 在沙箱Hadoop(Cloudera5.1/Hortonworks2.1)的R(build 1060)中是否有类似的问题?这似乎是新R/Hadoop的问题,因为在CDH5.0上它可以工作.
码:
Sys.setenv(HADOOP_CMD="/usr/bin/hadoop")
Sys.setenv(HADOOP_STREAMING="/usr/lib/hadoop-mapreduce/hadoop-streaming.jar")
Sys.setenv(JAVA_HOME="/usr/java/jdk1.7.0_55-cloudera")
library(rhdfs)
library(rmr2)
hdfs.init()
## space and word delimiter
map <- function(k,lines) {
words.list <- strsplit(lines, '\\s')
words <- unlist(words.list)
return( keyval(words, 1) )
}
reduce <- function(word, counts) {
keyval(word, sum(counts))
}
wordcount <- function (input, output=NULL) {
mapreduce(input=input, output=output, input.format="text", map=map, reduce=reduce)
}
## variables
hdfs.root <- '/user/cloudera'
hdfs.data <- file.path(hdfs.root, 'scenario_1')
hdfs.out <- file.path(hdfs.root, 'out')
## run mapreduce job
##out <- wordcount(hdfs.data, hdfs.out)
system.time(out <- wordcount(hdfs.data, hdfs.out))
Run Code Online (Sandbox Code Playgroud)
错误:
> system.time(out <- wordcount(hdfs.data, …
Run Code Online (Sandbox Code Playgroud) 我正在尝试安装最新dplyr
版本(版本0.4.1).但是,每次尝试install.packages("dplyr")
超过几天都会导致安装0.2版本.
> install.packages("dplyr")
Installing package into ‘C:/Users/Ricky/Documents/R/win-library/3.1’
(as ‘lib’ is unspecified)
trying URL 'http://mran.revolutionanalytics.com/snapshot/2014-10-01/bin/windows/contrib/3.1/dplyr_0.2.zip'
Content type 'application/zip' length 2235535 bytes (2.1 Mb)
opened URL
downloaded 2.1 Mb
Run Code Online (Sandbox Code Playgroud)
有什么步骤我不见了吗?这是Revolution Analytics用户特有的吗?
使用时下面的会话信息.
> sessionInfo()
R version 3.1.1 (2014-07-10)
Platform: x86_64-w64-mingw32/x64 (64-bit)
locale:
[1] LC_COLLATE=English_Singapore.1252 LC_CTYPE=English_Singapore.1252 LC_MONETARY=English_Singapore.1252
[4] LC_NUMERIC=C LC_TIME=English_Singapore.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] devtools_1.6
loaded via a namespace (and not attached):
[1] tools_3.1.1
Run Code Online (Sandbox Code Playgroud)
编辑: .libPaths()
添加输出
> …
Run Code Online (Sandbox Code Playgroud) 我有Revolution-R-Community-4.3.0,附带R版本2.12.2.我想更新到R 2.14.我喜欢这样做,保留Revolution-R的一些性能增强库.
如果我以另一种方式提出这个问题.我怎么能创建自己的具有相同性能的R分布.也包含在Revo中的包装.我可以添加到我的安装中的R.
r ×9
revolution-r ×9
mapreduce ×2
blas ×1
devtools ×1
dplyr ×1
hadoop ×1
hadoop-yarn ×1
installation ×1
intel-mkl ×1
microsoft-r ×1
nlme ×1
r-package ×1
rhadoop ×1
timeout ×1
windows ×1