我使用R中的topGO包来分析基因富集,使用以下代码:
sampleGOdata <- new("topGOdata", description = "Simple session", ontology = "BP",
allGenes = geneList, geneSel = topDiffGenes, nodeSize = 10,
annot = annFUN.db, affyLib = affyLib)
resultFisher <- runTest(sampleGOdata, algorithm = "classic", statistic = "fisher")
allRes <- GenTable(sampleGOdata, classicFisher = resultFisher, orderBy = "fisher",
ranksOf = "classicFisher",topNodes = 10)
Run Code Online (Sandbox Code Playgroud)
我想看到和更改的RunTest功能和GenTable更改的功能ResultTable,但我不知道如何表达的功能.随着getAnywhere("GenTable")我没有得到我想要的硬代码.
getAnywhere("GenTable")
Run Code Online (Sandbox Code Playgroud)
找到了匹配"GenTable"的单个对象
它在以下地方被发现
Run Code Online (Sandbox Code Playgroud)package:topGO namespace:topGO有价值的
Run Code Online (Sandbox Code Playgroud)function (object, ...) standardGeneric("GenTable") <environment: 0x16a30c10> attr(,"generic") [1] "GenTable" attr(,"generic")attr(,"package") [1] "topGO" attr(,"package") [1] "topGO" attr(,"group") …
所以这是一个非常简单的问题,似乎无法弄明白.
我正在使用glm函数运行logit,但不断收到与自变量相关的警告消息.它们被存储为因素,我已将它们更改为数字,但没有运气.我也将它们编码为0/1,但这也没有用.
请帮忙!
> mod2 <- glm(winorlose1 ~ bid1, family="binomial")
Warning messages:
1: glm.fit: algorithm did not converge
2: glm.fit: fitted probabilities numerically 0 or 1 occurred
Run Code Online (Sandbox Code Playgroud)
我也在Zelig尝试过,但类似的错误:
> mod2 = zelig(factor(winorlose1) ~ bid1, data=dat, model="logit")
How to cite this model in Zelig:
Kosuke Imai, Gary King, and Oliva Lau. 2008. "logit: Logistic Regression for Dichotomous Dependent Variables" in Kosuke Imai, Gary King, and Olivia Lau, "Zelig: Everyone's Statistical Software," http://gking.harvard.edu/zelig
Warning messages:
1: glm.fit: algorithm did not converge
2: …Run Code Online (Sandbox Code Playgroud) 我最近一直在使用ggplot2来创建一堆等值线.我想知道是否可以使用ggplot2来创建类似于此的地图(来自WorldMapper):

这是一个等角度,其中shapefile多边形被扭曲以表示相对人口数.我相信这被称为制图.他们用一堆其他变量做到这一点.本着Choropleth R Challenge的精神,有谁知道如何使用R?
cat并且print似乎都在提供R的"打印"功能
x <- 'Hello world!\n'
cat(x)
# Hello world!
print(x)
# [1] "Hello world!\n"
Run Code Online (Sandbox Code Playgroud)
我的印象是,cat大多数类似于典型的"打印"功能.我什么时候使用cat,何时使用print?
作为在Windows下运行R的大型任务的一部分,我想在目录之间复制选定的文件.是否有可能在R内给出一个命令cp patha/filea*.csv pathb(注意通配符,额外的香料)?
为什么模型矩阵必须与数据帧具有相同的行数?
mergem = model.matrix(as.formula(paste(response, '~ .')), data=mergef)
dim(mergef)
# [1] 115562 71
dim(mergem)
# [1] 66786 973
Run Code Online (Sandbox Code Playgroud)
我试图在文档中寻找提示,但找不到任何东西.提前致谢.
我想用R编程语言处理Apache Parquet文件(在我的例子中,在Spark中生成).
是否有R读卡器?或者正在进行一项工作?
如果没有,那么到达那里最方便的方式是什么?注意:有Java和C++绑定:https://github.com/apache/parquet-mr
R有一些内存分析工具,比如 Rprofmem(),Rprof()选项"memory.profiling=TRUE"和tracemem().最后一个只能用于对象,因此可以跟踪复制对象的次数,但不提供基于函数的概述.Rprofmem应该能够做到这一点,但即使是最简单的函数调用的输出也会lm()提供超过500行的日志.我试图找出究竟Rprof("somefile.log",memory.profile=T)做了什么,但我不认为我真的明白了.
我能找到的最后一个是托马斯·拉姆利的这个消息,说道,我引述:
我还没有工具来总结输出.
这是在2006年也有一些不错摘要选择现在任何机会,主要是基于Rprofmem(),神秘的输出Rprof()与memory.profile设置为TRUE或任何其他工具?
我对使用.SD和不太清楚by.
例如,做下面的代码片段意思是:"改变所有的列DT到的因素,除了A与B?" 它还在data.table手册中说:" .SD指data.table每个组的子集(不包括分组列)" - 所以列A和B排除?
DT = DT[ ,lapply(.SD, as.factor), by=.(A,B)]
Run Code Online (Sandbox Code Playgroud)
但是,我也读过,by当你进行聚合时,这意味着在SQL中使用'group by'.例如,如果我想colsum在除了所有列之外总结(比如在SQL中)A并且B我仍然使用类似的东西吗?或者在这种情况下,下面的代码是否意味着在列A和B?中取总和和值组?(A,B在SQL中使用sum和group by )
DT[,lapply(.SD,sum),by=.(A,B)]
Run Code Online (Sandbox Code Playgroud)
然后我如何做colsum除了A和之外的所有列的简单B?
有没有办法防止data.table在通过引用分配新列后打印新的data.table?我收集的标准行为是
library(data.table)
example(data.table)
DT
# x y v
# 1: a 1 42
# 2: a 3 42
# 3: a 6 42
# 4: b 1 11
# 5: b 3 11
# 6: b 6 11
# 7: c 1 7
# 8: c 3 8
# 9: c 6 9
DT[,z:=1:nrow(DT)]
# x y v z
# 1: a 1 42 1
# 2: a 3 42 2
# 3: a 6 42 3
# …Run Code Online (Sandbox Code Playgroud)