小编Ben*_*ker的帖子

如何删除数据框中的行?

我有一个名为"mydata"的数据框,如下所示:

   A  B  C   D 
1. 5  4  4   4 
2. 5  4  4   4 
3. 5  4  4   4 
4. 5  4  4   4 
5. 5  4  4   4 
6. 5  4  4   4 
7. 5  4  4   4 
Run Code Online (Sandbox Code Playgroud)

我想删除第2,4,6行.例如,像这样:

   A  B  C   D
1. 5  4  4  4 
3. 5  4  4  4 
5. 5  4  4  4 
7. 5  4  4  4 
Run Code Online (Sandbox Code Playgroud)

row r

203
推荐指数
7
解决办法
100万
查看次数

如何在R脚本中全局抑制警告

我有一个很长的R脚本会抛出一些警告,我可以忽略它.我可以用

suppressWarnings(expr)
Run Code Online (Sandbox Code Playgroud)

单一陈述.但是如何在全球范围内抑制R中的警告?这有选择吗?

warnings r

161
推荐指数
4
解决办法
16万
查看次数

将所有0值替换为NA

我有一个带有一些数字列的数据框.某些行具有0值,在统计分析中应将其视为空值.在R中将所有0值替换为NULL的最快方法是什么?

r

124
推荐指数
8
解决办法
29万
查看次数

分数太多的散点图

我试图绘制两个变量,其中N = 700K.问题是重叠太多,因此情节大部分都是黑色的固体块.是否有任何方法可以使用灰度"云",其中图的黑暗是区域中点数的函数?换句话说,我不希望显示单个点,而是希望绘图为"云",区域中的点数越多,该区域越暗.

r scatter-plot

119
推荐指数
7
解决办法
7万
查看次数

将数据帧的一行转换为矢量

我想从一行数据帧中创建一个向量.但我不想要行和列名称.我尝试了几件事......但没有运气.

这是我的数据框:

> df <- data.frame(a=c(1,2,4,2),b=c(2,6,2,1),c=c(2.6,8.2,7.5,3))
> df
  a b   c
1 1 2 2.6
2 2 6 8.2
3 4 2 7.5
4 2 1 3.0
Run Code Online (Sandbox Code Playgroud)

我试过了:

> newV <- as.vector(df[1,])
> newV
  a b   c
1 1 2 2.6
Run Code Online (Sandbox Code Playgroud)

但我真的想要这样的东西:

> newV <- c( 1,2,2.6)
> newV
[1] 1.0 2.0 2.6
Run Code Online (Sandbox Code Playgroud)

任何帮助,非常感谢.

r vector dataframe

103
推荐指数
5
解决办法
13万
查看次数

如何使用'扫描'功能

当我查看R Packages的源代码时,我会看到sweep常用的函数.有时候,当一个更简单的函数已经足够时(例如,apply),它会被使用,有时,如果不花费相当多的时间来逐步执行代码块,就不可能确切地知道它在做什么.

我可以sweep使用更简单的函数重现效果的事实表明我不理解sweep核心用例,并且这个函数经常使用的事实表明它非常有用.

上下文:

sweep是R标准库中的一个函数; 它的论点是:

sweep(x, MARGIN, STATS, FUN="-", check.margin=T, ...)

# x is the data
# STATS refers to the summary statistics which you wish to 'sweep out'
# FUN is the function used to carry out the sweep, "-" is the default
Run Code Online (Sandbox Code Playgroud)

正如你所看到的,参数类似于applysweep需要一个参数,STATS.

另一个关键区别是sweep返回一个与输入数组相同形状的数组,而返回的结果apply取决于传入的函数.

sweep 在行动:

# e.g., use 'sweep' to express a given matrix in …
Run Code Online (Sandbox Code Playgroud)

statistics r

95
推荐指数
3
解决办法
4万
查看次数

提取回归系数值

我有一个回归模型的一些时间序列数据调查药物利用率.目的是将样条拟合到时间序列并计算95%CI等.模型如下:

id <- ts(1:length(drug$Date))
a1 <- ts(drug$Rate)
a2 <- lag(a1-1)
tg <- ts.union(a1,id,a2)
mg <-lm (a1~a2+bs(id,df=df1),data=tg) 
Run Code Online (Sandbox Code Playgroud)

摘要输出mg是:

Call:
lm(formula = a1 ~ a2 + bs(id, df = df1), data = tg)

Residuals:
     Min       1Q   Median       3Q      Max 
-0.31617 -0.11711 -0.02897  0.12330  0.40442 

Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
(Intercept)        0.77443    0.09011   8.594 1.10e-11 ***
a2                 0.13270    0.13593   0.976  0.33329    
bs(id, df = df1)1 -0.16349    0.23431  -0.698  0.48832    
bs(id, df = df1)2  0.63013    0.19362   3.254  0.00196 ** 
bs(id, …
Run Code Online (Sandbox Code Playgroud)

regression r lm

66
推荐指数
3
解决办法
16万
查看次数

ggplot2中facet_wrap()和facet_grid()之间有什么区别?

我一直在阅读这ggplot2两个功能的文档.我想知道使用每个函数(facet_wrap()facet_grid())的差异和正确的情况是什么.

library(ggplot2)

p <- qplot(displ, hwy, data = mpg)
p + facet_wrap(~ cyl)

p + facet_grid(~ cyl)
Run Code Online (Sandbox Code Playgroud)

我提供这个小例子作为起点.差异似乎是包裹使得情节更加自主,并且网格使得一个情节全部在一起.

r ggplot2 facet-wrap

64
推荐指数
4
解决办法
5万
查看次数

寻找局部最大值和最小值

我正在寻找一种计算有效的方法来为R中的大数字列表找到局部最大值/最小值.希望没有for循环...

例如,如果我有一个数据文件1 2 3 2 1 1 2 1,我希望函数返回3和7,它们是局部最大值的位置.

r

61
推荐指数
7
解决办法
6万
查看次数

如何按组获取摘要统计信息

我试图在R/S-PLUS中一次性按分类列分组获得多个汇总统计信息.我找到了几个函数,但是每个函数都会执行一次统计,比如`aggregate().

data <- c(62, 60, 63, 59, 63, 67, 71, 64, 65, 66, 68, 66, 
          71, 67, 68, 68, 56, 62, 60, 61, 63, 64, 63, 59)
grp <- factor(rep(LETTERS[1:4], c(4,6,6,8)))
df <- data.frame(group=grp, dt=data)
mg <- aggregate(df$dt, by=df$group, FUN=mean)    
mg <- aggregate(df$dt, by=df$group, FUN=sum)    
Run Code Online (Sandbox Code Playgroud)

我正在寻找的是在一次通话中获得同一组的多个统计数据,如mean,min,max,std,...等,这是可行的吗?

r s

61
推荐指数
10
解决办法
17万
查看次数

标签 统计

r ×10

dataframe ×1

facet-wrap ×1

ggplot2 ×1

lm ×1

regression ×1

row ×1

s ×1

scatter-plot ×1

statistics ×1

vector ×1

warnings ×1