我有一个名为"mydata"的数据框,如下所示:
A B C D
1. 5 4 4 4
2. 5 4 4 4
3. 5 4 4 4
4. 5 4 4 4
5. 5 4 4 4
6. 5 4 4 4
7. 5 4 4 4
Run Code Online (Sandbox Code Playgroud)
我想删除第2,4,6行.例如,像这样:
A B C D
1. 5 4 4 4
3. 5 4 4 4
5. 5 4 4 4
7. 5 4 4 4
Run Code Online (Sandbox Code Playgroud) 我有一个很长的R脚本会抛出一些警告,我可以忽略它.我可以用
suppressWarnings(expr)
Run Code Online (Sandbox Code Playgroud)
单一陈述.但是如何在全球范围内抑制R中的警告?这有选择吗?
我试图绘制两个变量,其中N = 700K.问题是重叠太多,因此情节大部分都是黑色的固体块.是否有任何方法可以使用灰度"云",其中图的黑暗是区域中点数的函数?换句话说,我不希望显示单个点,而是希望绘图为"云",区域中的点数越多,该区域越暗.
我想从一行数据帧中创建一个向量.但我不想要行和列名称.我尝试了几件事......但没有运气.
这是我的数据框:
> df <- data.frame(a=c(1,2,4,2),b=c(2,6,2,1),c=c(2.6,8.2,7.5,3))
> df
a b c
1 1 2 2.6
2 2 6 8.2
3 4 2 7.5
4 2 1 3.0
Run Code Online (Sandbox Code Playgroud)
我试过了:
> newV <- as.vector(df[1,])
> newV
a b c
1 1 2 2.6
Run Code Online (Sandbox Code Playgroud)
但我真的想要这样的东西:
> newV <- c( 1,2,2.6)
> newV
[1] 1.0 2.0 2.6
Run Code Online (Sandbox Code Playgroud)
任何帮助,非常感谢.
当我查看R Packages的源代码时,我会看到sweep
常用的函数.有时候,当一个更简单的函数已经足够时(例如,apply
),它会被使用,有时,如果不花费相当多的时间来逐步执行代码块,就不可能确切地知道它在做什么.
我可以sweep
使用更简单的函数重现效果的事实表明我不理解sweep
核心用例,并且这个函数经常使用的事实表明它非常有用.
上下文:
sweep
是R标准库中的一个函数; 它的论点是:
sweep(x, MARGIN, STATS, FUN="-", check.margin=T, ...)
# x is the data
# STATS refers to the summary statistics which you wish to 'sweep out'
# FUN is the function used to carry out the sweep, "-" is the default
Run Code Online (Sandbox Code Playgroud)
正如你所看到的,参数类似于apply
但sweep
需要一个参数,STATS
.
另一个关键区别是sweep
返回一个与输入数组相同形状的数组,而返回的结果apply
取决于传入的函数.
sweep
在行动:
# e.g., use 'sweep' to express a given matrix in …
Run Code Online (Sandbox Code Playgroud) 我有一个回归模型的一些时间序列数据调查药物利用率.目的是将样条拟合到时间序列并计算95%CI等.模型如下:
id <- ts(1:length(drug$Date))
a1 <- ts(drug$Rate)
a2 <- lag(a1-1)
tg <- ts.union(a1,id,a2)
mg <-lm (a1~a2+bs(id,df=df1),data=tg)
Run Code Online (Sandbox Code Playgroud)
摘要输出mg
是:
Call:
lm(formula = a1 ~ a2 + bs(id, df = df1), data = tg)
Residuals:
Min 1Q Median 3Q Max
-0.31617 -0.11711 -0.02897 0.12330 0.40442
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.77443 0.09011 8.594 1.10e-11 ***
a2 0.13270 0.13593 0.976 0.33329
bs(id, df = df1)1 -0.16349 0.23431 -0.698 0.48832
bs(id, df = df1)2 0.63013 0.19362 3.254 0.00196 **
bs(id, …
Run Code Online (Sandbox Code Playgroud) 我一直在阅读这ggplot2
两个功能的文档.我想知道使用每个函数(facet_wrap()
和facet_grid()
)的差异和正确的情况是什么.
library(ggplot2)
p <- qplot(displ, hwy, data = mpg)
p + facet_wrap(~ cyl)
p + facet_grid(~ cyl)
Run Code Online (Sandbox Code Playgroud)
我提供这个小例子作为起点.差异似乎是包裹使得情节更加自主,并且网格使得一个情节全部在一起.
我正在寻找一种计算有效的方法来为R中的大数字列表找到局部最大值/最小值.希望没有for
循环...
例如,如果我有一个数据文件1 2 3 2 1 1 2 1
,我希望函数返回3和7,它们是局部最大值的位置.
我试图在R/S-PLUS中一次性按分类列分组获得多个汇总统计信息.我找到了几个函数,但是每个函数都会执行一次统计,比如`aggregate().
data <- c(62, 60, 63, 59, 63, 67, 71, 64, 65, 66, 68, 66,
71, 67, 68, 68, 56, 62, 60, 61, 63, 64, 63, 59)
grp <- factor(rep(LETTERS[1:4], c(4,6,6,8)))
df <- data.frame(group=grp, dt=data)
mg <- aggregate(df$dt, by=df$group, FUN=mean)
mg <- aggregate(df$dt, by=df$group, FUN=sum)
Run Code Online (Sandbox Code Playgroud)
我正在寻找的是在一次通话中获得同一组的多个统计数据,如mean,min,max,std,...等,这是可行的吗?
r ×10
dataframe ×1
facet-wrap ×1
ggplot2 ×1
lm ×1
regression ×1
row ×1
s ×1
scatter-plot ×1
statistics ×1
vector ×1
warnings ×1