我xtabs用来制作一些包含NAs的数据.为了确保总数完整,我addNA用来计算缺少因子水平的那些.
但是,这会导致在xtable导出到LaTeX for Sweaving 时出现问题,因为现在NA行和列名称中都有.我有一个解决方案:
rownames(tab)[is.na(rownames(tab))]<-"NA"
colnames(tab)[is.na(colnames(tab))]<-"NA"
Run Code Online (Sandbox Code Playgroud)
但是对于很多桌子来说这可能会很烦人,有没有办法更自动地做到这一点?或者是否有更好的方法来制作表格?
是否有可能过滤掉ggplot2调用中具有少量观察数据的子集?
例如,采取以下图表: qplot(price,data=diamonds,geom="density",colour=cut)

情节有点忙,我希望cut用少量的观察结果来排除这些值,即
> xtabs(~cut,diamonds)
cut
Fair Good Very Good Premium Ideal
1610 4906 12082 13791 21551
Run Code Online (Sandbox Code Playgroud)
的Fair和Good所述的品质cut因子.
我想要一个可以适应任意数据集的解决方案,如果可能的话,不仅可以选择阈值数量的观测值,而且可以选择前3个.
我尝试使用以下R命令将不同的制表符分隔文件合并到单个文件中.
如果你观察,我甚至使用write.table命令保存文件.现在我需要阅读相同的文件以进行进一步分析.我面临的最大问题是,有一个额外的列没有自动创建任何列名.
如果您发现使用write.table函数时自动创建了一列(红色).我想摆脱那一栏,因为它妨碍了所有进一步的计算.
combine=function(file) {
split_list <- unlist(strsplit(file,split=","))
setwd("D:/combine")
dataset <- do.call("cbind",lapply(split_list,FUN=function(files) { read.table(files,header=TRUE, sep="\t") } ) )
names(dataset)[1]=paste("Probe_ID")
drop=c("ProbeID")
dataset=dataset[,!(names(dataset)%in%drop)]
dataset$X=NULL
write.table(dataset,file="D:/output/illumina.txt",sep="\t",col.names=NA)
return ("illumina.txt")
}
Run Code Online (Sandbox Code Playgroud) 我是 R 的新手,我有一个简单的问题(我认为),但到目前为止我还没有找到解决方案。我有一组(长)2D (x,y) 坐标 - 只是 2D 空间中的点,如下所示:
ID x y
1 1758.56 1179.26
2 775.67 1197.14
3 296.99 1211.13
4 774.72 1223.66
5 805.41 1235.51
6 440.67 1247.59
7 1302.02 1247.93
8 1450.4 1259.13
9 664.99 1265.9
10 2781.05 1291.12
etc.....
Run Code Online (Sandbox Code Playgroud)
如何过滤特定区域(任何形状!)中的点(表中的行)?如何过滤指定坐标子集中的点。如何指定需要/不需要的区域子集?以及如何将其放入 R 中?:) 提前很多!
我正在尝试以JSON格式处理一些数据.rjson::fromJSON成功导入数据并将其放入一个非常笨重的列表中.
library(rjson)
y <- fromJSON(file="http://api.lmiforall.org.uk/api/v1/wf/predict/breakdown/region?soc=6145&minYear=2014&maxYear=2020")
str(y)
List of 3
$ soc : num 6145
$ breakdown : chr "region"
$ predictedEmployment:List of 7
..$ :List of 2
.. ..$ year : num 2014
.. ..$ breakdown:List of 12
.. .. ..$ :List of 3
.. .. .. ..$ code : num 1
.. .. .. ..$ name : chr "London"
.. .. .. ..$ employment: num 74910
.. .. ..$ :List of 3
.. .. .. ..$ code …Run Code Online (Sandbox Code Playgroud) 我想对我拥有的一些数据点执行 log Pearson III 拟合。但是,每次我尝试这样做时,都会收到错误消息,我真的不知道该怎么办。我也许应该补充一点,从几天前开始我只使用 R,所以,我不是这方面的专家。
重要的代码部分,没有导入内容的部分等等是这样的:
pIIIpars<-list(shape=1, location=1, scale=1)
dPIII<-function(x, shape, location, scale) PearsonDS::dpearsonIII(x, shape=1, location=1, scale=1, params=pIIIpars, log=FALSE)
pPIII<-function(q, shape, location, scale) PearsonDS::ppearsonIII(q, shape=1, location=1, scale=1, params=pIIIpars, lower.tail = TRUE, log.p = FALSE)
qPIII<-function(p, shape, location, scale) PearsonDS::qpearsonIII(p, shape=1, location=1, scale=1, params=pIIIpars, lower.tail = TRUE, log.p = FALSE)
fitPIII<-fitdistrplus::fitdist(flowdata3$OEP, distr="PIII", method="mle", start=list("shape"=5000, "location"=5000, "scale"=5000))
summary(fitPIII)
plot(fitPIII)
Run Code Online (Sandbox Code Playgroud)
我使用 PearsonDS 包来定义 Log Pearson III 分布,并使用 fitdistrplus 进行拟合。
我总是得到的错误信息是这样的:
[1] "Error in optim(par = vstart, fn = fnobj, fix.arg = fix.arg, …Run Code Online (Sandbox Code Playgroud) 我的问题是我如何能够为do.call函数添加更多参数.例如,我想绘制多面grid图grid.arrange,如何添加更多参数,例如ncol=3和main="main title"命令do.call(grid.arrange,plots)?
如果我有一个类似于下面的数据帧
a=data.frame(year=paste('FY',2001:2012,sep='.'),values=rnorm(12))
library(ggplot2)
Run Code Online (Sandbox Code Playgroud)
以下图表有效
ggplot(a,aes(x=year,y=values,group=1))+geom_line()
Run Code Online (Sandbox Code Playgroud)
但是下面没有.
ggplot(a,aes(x=year,y=values,group=1))+geom_line() +xlim(0,13)
Run Code Online (Sandbox Code Playgroud)
如何扩展具有类别轴而非数字轴的ggplot数据的限制?
我正在尝试运行包括自变量平方的回归.其他转换似乎有效,但广场无法识别.例如
lm(y ~ x + x^2 + sin(x), data=as.data.frame(cbind(x=rnorm(10), y=rnorm(10))))
Call:
lm(formula = y ~ x + x^2 + sin(x), data = as.data.frame(cbind(x = rnorm(10),
y = rnorm(10))))
Coefficients:
(Intercept) x sin(x)
-0.1594 -0.6171 1.2072
Run Code Online (Sandbox Code Playgroud)
罪被认出,但x ^ 2不是.
第一个问题.我是R的新人.我有以下数据框.
Source: local data frame [865,264 x 10]
page_views date dayofweek daytype caseID dateDecision dateArgument dateRearg
1 169 2008-01-30 Wednesday 0 2007-001 2007-10-10 2007-10-01
2 211 2008-01-16 Wednesday 0 2007-001 2007-10-10 2007-10-01
3 203 2008-01-17 Thursday 0 2007-001 2007-10-10 2007-10-01
4 177 2008-01-14 Monday 0 2007-001 2007-10-10 2007-10-01
5 224 2008-01-15 Tuesday 0 2007-001 2007-10-10 2007-10-01
6 152 2008-01-12 Saturday 1 2007-001 2007-10-10 2007-10-01
7 149 2008-01-13 Sunday 1 2007-001 2007-10-10 2007-10-01
8 220 2008-01-10 Thursday 0 2007-001 2007-10-10 2007-10-01 …Run Code Online (Sandbox Code Playgroud)