使用 Rstudio Server 时,可以非常轻松地通过“文件”>“更多”>“导出...”从服务器下载文件。Web 浏览器将自动开始下载。
有没有办法使用 R 命令生成此下载?
假设数据看起来像
group1 group2 num
A sg 1
A sh 2
A sg 4
B at 3
B al 7
Run Code Online (Sandbox Code Playgroud)
a <- cumsum(data[,"num"]) # 1 3 7 10 17
我需要团体积累的东西.实际上,我有多列作为分组指标.我想通过我定义的子组获得累积的总和.
例如
如果我group1只分组,那么输出应该是
group1 sum
A 1
A 3
A 7
B 3
B 10
Run Code Online (Sandbox Code Playgroud)
如果我按两个变量分组,group1,group2则输出为
group1 group2 sum
A sg 1
A sh 2
A sg 5
B at 3
B al 7
Run Code Online (Sandbox Code Playgroud) 我用ggplot准备了牛眼图.但是我得到了一个洞.如何删除它并获得整个?
critters <- structure(list( a = 15, b = 47, c = 22, d=9, e=7), .Names = c("a", "b", "c", "d", "e"), row.names = c(NA, -1L), class = "data.frame")
d <- data.frame(test=factor(c(rep("a", critters$a),
rep("b", critters$b),
rep("c", critters$c),
rep("d", critters$d),
rep("e", critters$e)),
levels = c("a", "b", "c", "d", "e"), ordered= TRUE))
levels(d$test) <- apply(data.frame(table(d$test)), 1, paste, collapse = ": ")
ggplot(d, aes(x = factor(1), fill = factor(test))) + geom_bar()+ coord_polar() + labs(x = NULL, fill = NULL) + scale_fill_manual(values = c("blue", …Run Code Online (Sandbox Code Playgroud) 我有一个拥有> 300,000份动物观察记录的数据库.每行代表一个动物位置.每只动物都有一个唯一的id(id1)和几个具有与该动物位置相关的属性的列,包括观察日期和x和y坐标.
有人可以帮我创建一个允许我进行以下操作的代码:
1)BOTH date和BOT的子集数据id1
2)测量date每个不同的FIRST和LAST位置记录之间的距离(坐标为UTM,距离以米为单位)id1
数据的一个示例如下:
mydata<-read.table(text =
"id1 date x y
1 11/02/2014 478776.4332 7922167.59
1 11/02/2014 478776.4333 7922170.59
1 11/02/2014 478776.4334 7922180.59
1 12/02/2014 478776.4335 7922190.59
1 12/02/2014 478776.4350 7922192.59
1 12/02/2014 478776.4360 7922195.59
2 11/02/2014 478776.4338 7922167.59
2 11/02/2014 478776.4339 7922183.59
2 11/02/2014 478776.4340 7922185.59
2 12/02/2014 478776.4350 7922188.30
2 12/02/2014 478776.4360 7922190.59
2 12/02/2014 478776.4390 7922198.59
3 11/02/2014 478776.4338 7922167.59
3 11/02/2014 478776.4345 7922175.59
3 11/02/2014 478776.4355 7922178.85 …Run Code Online (Sandbox Code Playgroud) 我有一个我想hist在 R 中绘制的数据集。数据集中有许多行的值超出了我关心的值。具体来说,我的 R 脚本是:
library(ggplot2)
data = read.table("input.txt", sep=" ", strip.white=TRUE, header=TRUE)
pdf("out.pdf")
hist(data$actions,breaks=seq(0,130,by=1))
dev.off()
Run Code Online (Sandbox Code Playgroud)
一个示例数据集input.txt是:
name actions
foo 3
bar 129
baz 131
Run Code Online (Sandbox Code Playgroud)
如果我运行 R 脚本,我会收到一个错误:
hist.default(data$actions,breaks = seq(0, 130, by = 1), 中的错误:
一些 'x' 未计算在内;也许 'breaks' 不跨越 'x'
调用的范围:hist -> hist。默认
执行停止
我知道为什么会出现这个错误:出现了一次大于 130baz的值,即值为 131。
我想要的是仅为0 到 130 指定范围内的频率创建直方图,并且对于该范围之外的所有频率都将被静默忽略。我怎样才能做到这一点?
假设有一个向量:
v1 <- c("ab", "bc", "cd", "ef", "yolo", "da", "sm", "ez-de")
v2 <- c("ab", "bc", "cd", "ef", "yolo-da", "sm", "ez", "de")
Run Code Online (Sandbox Code Playgroud)
你如何合并上面的两个向量,以便我们得到以下结果?
c("ab", "bc", "cd", "ef", "yolo-da", "sm", "ez-de")
Run Code Online (Sandbox Code Playgroud)
请注意,上面的两个向量具有相同的长度..
我无法找到此错误的修复程序.我之前已经实施了解决方法,但我想知道这里是否有人知道它为什么会发生.
以下不会按预期返回错误
q <- list()
q[["a"]][["b"]] <- 3
q[["a"]][["c"]] <- 4
Run Code Online (Sandbox Code Playgroud)
但是,当我添加另一个嵌套级别时,我得到:
q <- list()
q[["a"]][["b"]][["c"]]<- 3
q[["a"]][["b"]][["d"]] <- 4
Run Code Online (Sandbox Code Playgroud)
q [["a"]]中的错误[["b"]] [["d"]] < - 4:提供的元素多于要替换的元素
如果我添加第四个嵌套列表,这会让我更加困惑:
q <- list()
q[["a"]][["b"]][["c"]][["d"]] <- 3
q[["a"]][["b"]][["c"]][["e"]] <- 4
Run Code Online (Sandbox Code Playgroud)
*tmp*[["c"]]中的错误:下标越界
我原本期望R为三重嵌套列表返回与四重嵌套列表相同的错误消息.
几个月前我第一次遇到这个问题.我正在运行R 3.4.3.
我遇到了一个看似简单的问题,但我无法找到解决方案。也就是说,我有一个表,其中第一列包含所有可用应用程序的列表,而其他列代表用户及其拥有的应用程序列表:
我正在尝试将表转换为 pandas DataFrame 并在第一列上对齐匹配值。所需的输出应如下所示:
import pandas as pd
df = pd.read_excel('U:/Desktop/appdata.xlsx')
df.head(10)
Out[21]:
Applications User 1 User 2 User 3 User 4 User 5
0 App1 App1 App2 App1 App1 App2
1 App2 App3 App3 App2 App3 App3
2 App3 App10 App4 App7 App4 App4
3 App4 NaN App5 App8 App5 App5
4 App5 NaN NaN App10 App6 App6
5 App6 NaN NaN NaN NaN App7
6 App7 NaN NaN NaN NaN App8
7 App8 NaN NaN NaN NaN …Run Code Online (Sandbox Code Playgroud) 我想使用该quantreg包从分位数回归中提取系数以及上限和下限。这是帮助文件中的示例。
data(engel)
attach(engel)
taus <- c(.05,.1,.25,.75,.9,.95)
f <- rq((foodexp)~(income),tau=taus)
sf <- summary(f)
sf[1]
#[[1]]
#Call: rq(formula = (foodexp) ~ (income), tau = taus)
#tau: [1] 0.05
#Coefficients:
# coefficients lower bd upper bd
#(Intercept) 124.88004 98.30212 130.51695
#income 0.34336 0.34333 0.38975
Run Code Online (Sandbox Code Playgroud)
我知道我可以用来coefficients()获取系数。
cf <- t(data.frame(coefficients(f))) # transpose for better arrangement
cf
# (Intercept) income
#tau..0.05 124.88004 0.3433611
#tau..0.10 110.14157 0.4017658
#tau..0.25 95.48354 0.4741032
#tau..0.75 62.39659 0.6440141
#tau..0.90 67.35087 0.6862995
#tau..0.95 64.10396 0.7090685
Run Code Online (Sandbox Code Playgroud)
但我不知道如何获得出现在summary(). 我看了 …
我正在创建一个邻接矩阵来在 R 中进行空间分析。数据都是美国大陆的县。我从美国人口普查老虎文件中获取了各县的空间多边形。
我能够创建邻居列表,并且它是对称的。但是当我将其转换为邻接矩阵时,它不是对称的。这是一个问题,因为我的目标是使用 运行空间自逻辑模型ngspatial::autologistic,并且出现错误,指出我必须提供对称二元邻接矩阵。
这是我创建邻接矩阵的 R 代码:
us<-readShapeSpatial("County_2010Census_DP1.shp")
#Trim out counties outside of continental US
us2<-us[!substr(us$GEOID10,1,2)%in%c('02','60','66','78','15','72'),]
us2.nb = poly2nb(us2)
is.symmetric.nb(us2.nb) #Comes out true
us2.adj = nb2mat(us2.nb, style="B",zero.policy=F)
isSymmetric(us2.adj) #comes out false
Run Code Online (Sandbox Code Playgroud)
顺便说一句,我可以splogit毫无问题地使用这个邻接矩阵。我不是空间分析方面的专家,所以我不能说我知道这些命令中发生了什么。