小编Mai*_*ura的帖子

帮助我通过亚马逊的EC2复制数据并运行脚本

就使用云计算而言,我是一个新手,但我得到了这个概念并且非常擅长遵循指令.我想对我的数据做一些模拟,每个步骤需要几分钟.鉴于我的数据中的层次结构,每组需要几个小时.我想通过在亚马逊的EC2云上运行它来加快速度.

阅读本文后,我知道如何启动AMI,通过shell连接到它,并在命令提示符下启动R.

我想要帮助的是能够复制数据(.rdata文件)和脚本,并在R命令提示符下获取它.然后,一旦将所有结果写入新的.rdata文件,我想将它们复制回本地计算机.

我该怎么做呢?

cloud amazon r amazon-ec2

5
推荐指数
1
解决办法
979
查看次数

如何在具有2个内核的macbook pro上运行多核?

所以这段代码:

library(plyr)
library(doMC) 
registerDoMC(cores=2) 
x=1:100
llply(x, some_function, .parallel=TRUE)
Run Code Online (Sandbox Code Playgroud)

失败并出现如下错误:

__THE_PROCESS_HAS_FORKED_AND_YOU_CANNOT_USE_THIS_COREFOUNDATION_FUNCTIONALITY___YOU_MUST_EXEC__ ()
Run Code Online (Sandbox Code Playgroud)

当我从终端运行R时,错误消失.所以它是关于GUI的东西打破了它.不幸的是,我与合作者共享此代码,所以我不能要求他们从终端运行它.这个论坛帖子看起来好像这个问题w/doMC后端来自我一直在寻找"/Applications/R.app/Contents/Resources/GUI- tools.R",但我并不是故意在R中这样做.应用程序.有没有办法解决这种冲突的行为?

我的Mac规格:还运行R GUI 2.13.1.OSX 10.7.1,带有64位R.app的doMC版本1.2.3.还有一台配备Intel Core 2 Duo的MB Pro 2.53

multicore r

5
推荐指数
1
解决办法
567
查看次数

两个 R 包可以在彼此依赖列表中吗?

比方说,我有3个包ABC

B连接到data repository 1该 API 并具有特定于该 API 的功能。

C连接到data repository 2该 API 并具有特定于该 API 的功能。

最终会有更多的子包。

A将具有generic适用于通过B和获取的数据的方法和其他常见功能(例如身份验证)C。这里的基本原理是,这将是一种更流畅的方式来跟上开发的步伐(例如,必须更新单个auth函数而不是在每个子包中都这样做)。因此,它是有道理的,A是对的依赖列表BC

但我也希望用户只安装A并访问所有子包。为此,我希望BC在其依赖列表中。

这可能吗?我应该有一个更好的工作流程吗?

workflow r

5
推荐指数
1
解决办法
140
查看次数

如何仅从路径中提取文件/ folder_name?

不幸的是我吮吸regexp.如果我有这样的路径:

/long/path/to/file,我只需要接触file.

如果有人供应file/我只需要file.

如果有人供应/file/,我仍然需要file.

我一直在使用stringr函数作为拐杖,但这似乎是直截了当的grep领域.请帮忙?

grep r stringr

5
推荐指数
1
解决办法
565
查看次数

使用RJSONIO在R中解析深层嵌套的JSON结构

我怀疑我在这里遗漏了一些明显的东西,但是如何解析R中深层嵌套的结构RJSONIO

例如 - 假设我直接想要results.data.json$MRData$RaceTable$Races[[1]]$Results[[8]]$Driver使用以下代码段引用$ familyName :

require(RJSONIO)
resultsURL='http://ergast.com/api/f1/2012/1/results.json'
results.data.json=fromJSON(resultsURL)
Run Code Online (Sandbox Code Playgroud)

RJSONIO似乎不想将..$Results[[i]]数据解析为结构化元素?

r

5
推荐指数
1
解决办法
4492
查看次数

将data.frame转换为单行

我有这些数据:

structure(list(type = c("journal", "all", "similar_age_1m", "similar_age_3m", 
"similar_age_journal_1m", "similar_age_journal_3m"), count = c("13972", 
"754555", "22408", "56213", "508", "1035"), rank = c("13759", 
"754043", "22339", "56074", "459", "947"), pct = c("98.48", "99.93", 
"99.69", "99.75", "90.35", "91.50")), .Names = c("type", "count", 
"rank", "pct"), row.names = c(NA, -6L), class = "data.frame")
Run Code Online (Sandbox Code Playgroud)

我想把它变成一行,列的名称2:4以相应的类型为前缀.例如journal.count,journal.rank......最快的方法是什么?出于某种原因dcast,reshape并没有为我做这个,我的解决方案有点太麻烦.

r plyr reshape

5
推荐指数
1
解决办法
851
查看次数

在两个可能的分隔符之一之前找到一个单词

word:12335
anotherword:2323434
totallydifferentword/455
word/32
Run Code Online (Sandbox Code Playgroud)

我需要前抢字符串:/仅使用基础R功能.我可以使用stringr但不想在我的包中添加另一个依赖项.单词可以具有可变数量的字符,但总是以(一个)分隔符结束.我不需要保留之后的内容.

regex r

5
推荐指数
1
解决办法
134
查看次数

将函数应用于列表列表的有效方法

我有80个相关项目的列表.每个列表都是一个长度为1000的列表.我想在每个列表上运行一个函数(1000个中的每一个),并将结果分配回原始对象.总数据超过150演出,所以我想确保在实际数据上运行之前这是最有效的.这个简单的例子是我需要的最佳方式吗?

# my actual function is obviously more complicated.
# But let's say the goal is to keep 2/5 items in each list
trivial <- function(foo) {
keep <- c("S1", "S2")
foo[which(keep %in% names(foo))]
}

sublist <- replicate(5, as.list(1:5), simplify=FALSE)
names(sublist) <- paste0("S", 1:5)
eachlist <- replicate(5, sublist, simplify = F)
a1 <- a2 <- a3 <- a4 <- a5 <- eachlist

# To clarify the layout
length(a1)
[1] 5
> length(a1[[1]])
[1] 5
> names(a1[[1]])
[1] "S1" "S2" "S3" …
Run Code Online (Sandbox Code Playgroud)

r plyr

5
推荐指数
1
解决办法
2783
查看次数

以交互方式保存文件?

使用tk_choose.filesfile.choose我能够以交互方式选择文件。是否有类似的功能,我可以让用户以交互方式决定在哪里保存 write.table 的输出?

file-io r

4
推荐指数
1
解决办法
2059
查看次数

有没有办法在启动R时抑制MOTD?

每次启动时,R都会加载一条长而冗余的消息.有没有办法在我的命令中清除这个.rprofile

目前我只是让它加载然后按⌘+ L清除它但是自动执行它会很好.

r startup

4
推荐指数
1
解决办法
281
查看次数

标签 统计

r ×10

plyr ×2

amazon ×1

amazon-ec2 ×1

cloud ×1

file-io ×1

grep ×1

multicore ×1

regex ×1

reshape ×1

startup ×1

stringr ×1

workflow ×1