小编Jam*_*mes的帖子

如何让addNA和xtable一起工作?

xtabs用来制作一些包含NAs的数据.为了确保总数完整,我addNA用来计算缺少因子水平的那些.

但是,这会导致在xtable导出到LaTeX for Sweaving 时出现问题,因为现在NA行和列名称中都有.我有一个解决方案:

rownames(tab)[is.na(rownames(tab))]<-"NA"
colnames(tab)[is.na(colnames(tab))]<-"NA"
Run Code Online (Sandbox Code Playgroud)

但是对于很多桌子来说这可能会很烦人,有没有办法更自动地做到这一点?或者是否有更好的方法来制作表格?

r xtable

3
推荐指数
1
解决办法
830
查看次数

按观察次数过滤ggplot2密度图

是否有可能过滤掉ggplot2调用中具有少量观察数据的子集?

例如,采取以下图表: qplot(price,data=diamonds,geom="density",colour=cut)

密度图

情节有点忙,我希望cut用少量的观察结果来排除这些值,即

> xtabs(~cut,diamonds)
cut
     Fair      Good Very Good   Premium     Ideal 
     1610      4906     12082     13791     21551
Run Code Online (Sandbox Code Playgroud)

FairGood所述的品质cut因子.

我想要一个可以适应任意数据集的解决方案,如果可能的话,不仅可以选择阈值数量的观测值,而且可以选择前3个.

r ggplot2

3
推荐指数
1
解决办法
3840
查看次数

删除Tab delim文件中的额外列

我尝试使用以下R命令将不同的制表符分隔文件合并到单个文件中.

如果你观察,我甚至使用write.table命令保存文件.现在我需要阅读相同的文件以进行进一步分析.我面临的最大问题是,有一个额外的列没有自动创建任何列名.使用Extra列(红色)在excel中打开的delim文件的屏幕截图如果您发现使用write.table函数时自动创建了一列(红色).我想摆脱那一栏,因为它妨碍了所有进一步的计算.我的实际输出就像我需要保存它一样

combine=function(file) { 
split_list <- unlist(strsplit(file,split=","))
setwd("D:/combine")
dataset <- do.call("cbind",lapply(split_list,FUN=function(files) { read.table(files,header=TRUE, sep="\t") } ) )
names(dataset)[1]=paste("Probe_ID")
drop=c("ProbeID")
dataset=dataset[,!(names(dataset)%in%drop)]
dataset$X=NULL
write.table(dataset,file="D:/output/illumina.txt",sep="\t",col.names=NA)
return ("illumina.txt") 
}
Run Code Online (Sandbox Code Playgroud)

r

3
推荐指数
1
解决办法
751
查看次数

R - 过滤器坐标

我是 R 的新手,我有一个简单的问题(我认为),但到目前为止我还没有找到解决方案。我有一组(长)2D (x,y) 坐标 - 只是 2D 空间中的点,如下所示:

ID  x   y
1   1758.56 1179.26
2    775.67 1197.14
3   296.99  1211.13
4   774.72  1223.66
5   805.41  1235.51
6   440.67  1247.59
7   1302.02 1247.93
8   1450.4  1259.13
9   664.99  1265.9
10  2781.05 1291.12
etc.....
Run Code Online (Sandbox Code Playgroud)

如何过滤特定区域(任何形状!)中的点(表中的行)?如何过滤指定坐标子集中的点。如何指定需要/不需要的区域子集?以及如何将其放入 R 中?:) 提前很多!

r subset filter area coordinates

3
推荐指数
1
解决办法
1375
查看次数

使用rjson处理JSON

我正在尝试以JSON格式处理一些数据.rjson::fromJSON成功导入数据并将其放入一个非常笨重的列表中.

library(rjson)
y <- fromJSON(file="http://api.lmiforall.org.uk/api/v1/wf/predict/breakdown/region?soc=6145&minYear=2014&maxYear=2020")
str(y)
List of 3
 $ soc                : num 6145
 $ breakdown          : chr "region"
 $ predictedEmployment:List of 7
  ..$ :List of 2
  .. ..$ year     : num 2014
  .. ..$ breakdown:List of 12
  .. .. ..$ :List of 3
  .. .. .. ..$ code      : num 1
  .. .. .. ..$ name      : chr "London"
  .. .. .. ..$ employment: num 74910
  .. .. ..$ :List of 3
  .. .. .. ..$ code …
Run Code Online (Sandbox Code Playgroud)

json r rjson

3
推荐指数
1
解决办法
3426
查看次数

在 R 中拟合 Log Pearson III 的问题

我想对我拥有的一些数据点执行 log Pearson III 拟合。但是,每次我尝试这样做时,都会收到错误消息,我真的不知道该怎么办。我也许应该补充一点,从几天前开始我只使用 R,所以,我不是这方面的专家。

重要的代码部分,没有导入内容的部分等等是这样的:

pIIIpars<-list(shape=1, location=1, scale=1) 

dPIII<-function(x, shape, location, scale) PearsonDS::dpearsonIII(x, shape=1, location=1, scale=1, params=pIIIpars, log=FALSE)

pPIII<-function(q, shape, location, scale) PearsonDS::ppearsonIII(q, shape=1, location=1, scale=1, params=pIIIpars, lower.tail = TRUE, log.p = FALSE)

qPIII<-function(p, shape, location, scale) PearsonDS::qpearsonIII(p, shape=1, location=1, scale=1, params=pIIIpars, lower.tail = TRUE, log.p = FALSE)

fitPIII<-fitdistrplus::fitdist(flowdata3$OEP, distr="PIII", method="mle", start=list("shape"=5000, "location"=5000, "scale"=5000))

summary(fitPIII)

plot(fitPIII)
Run Code Online (Sandbox Code Playgroud)

我使用 PearsonDS 包来定义 Log Pearson III 分布,并使用 fitdistrplus 进行拟合。

我总是得到的错误信息是这样的:

[1] "Error in optim(par = vstart, fn = fnobj, fix.arg = fix.arg, …
Run Code Online (Sandbox Code Playgroud)

r

2
推荐指数
1
解决办法
3567
查看次数

如何在R中的do.call中添加函数的更多参数

我的问题是我如何能够为do.call函数添加更多参数.例如,我想绘制多面gridgrid.arrange,如何添加更多参数,例如ncol=3main="main title"命令do.call(grid.arrange,plots)

plot r do.call

2
推荐指数
1
解决办法
1118
查看次数

R ggplot扩展了类别x轴的范围

如果我有一个类似于下面的数据帧

a=data.frame(year=paste('FY',2001:2012,sep='.'),values=rnorm(12))
library(ggplot2)
Run Code Online (Sandbox Code Playgroud)

以下图表有效

ggplot(a,aes(x=year,y=values,group=1))+geom_line() 
Run Code Online (Sandbox Code Playgroud)

但是下面没有.

ggplot(a,aes(x=year,y=values,group=1))+geom_line() +xlim(0,13)
Run Code Online (Sandbox Code Playgroud)

如何扩展具有类别轴而非数字轴的ggplot数据的限制?

r ggplot2

1
推荐指数
1
解决办法
2542
查看次数

在R公式中使用变量的平方

我正在尝试运行包括自变量平方的回归.其他转换似乎有效,但广场无法识别.例如

lm(y ~ x + x^2 + sin(x), data=as.data.frame(cbind(x=rnorm(10), y=rnorm(10))))

Call:
lm(formula = y ~ x + x^2 + sin(x), data = as.data.frame(cbind(x = rnorm(10), 
   y = rnorm(10))))

Coefficients:
(Intercept)            x       sin(x)  
    -0.1594      -0.6171       1.2072 
Run Code Online (Sandbox Code Playgroud)

罪被认出,但x ^ 2不是.

r formula

1
推荐指数
1
解决办法
401
查看次数

dplyr:查找事件发生的日期

第一个问题.我是R的新人.我有以下数据框.

Source: local data frame [865,264 x 10]

   page_views       date dayofweek daytype   caseID dateDecision dateArgument dateRearg
1         169 2008-01-30 Wednesday       0 2007-001   2007-10-10   2007-10-01          
2         211 2008-01-16 Wednesday       0 2007-001   2007-10-10   2007-10-01          
3         203 2008-01-17  Thursday       0 2007-001   2007-10-10   2007-10-01          
4         177 2008-01-14    Monday       0 2007-001   2007-10-10   2007-10-01          
5         224 2008-01-15   Tuesday       0 2007-001   2007-10-10   2007-10-01          
6         152 2008-01-12  Saturday       1 2007-001   2007-10-10   2007-10-01          
7         149 2008-01-13    Sunday       1 2007-001   2007-10-10   2007-10-01          
8         220 2008-01-10  Thursday       0 2007-001   2007-10-10   2007-10-01 …
Run Code Online (Sandbox Code Playgroud)

r dplyr

1
推荐指数
1
解决办法
592
查看次数

标签 统计

r ×10

ggplot2 ×2

area ×1

coordinates ×1

do.call ×1

dplyr ×1

filter ×1

formula ×1

json ×1

plot ×1

rjson ×1

subset ×1

xtable ×1