小编Mic*_*ico的帖子

如何在包中显示S4功能的源代码?

我使用R中的topGO包来分析基因富集,使用以下代码:

sampleGOdata <- new("topGOdata", description = "Simple session", ontology = "BP",
                    allGenes = geneList, geneSel = topDiffGenes, nodeSize = 10, 
                    annot = annFUN.db, affyLib = affyLib)
resultFisher <- runTest(sampleGOdata, algorithm = "classic", statistic = "fisher")
allRes <- GenTable(sampleGOdata, classicFisher = resultFisher, orderBy = "fisher", 
                   ranksOf = "classicFisher",topNodes = 10)
Run Code Online (Sandbox Code Playgroud)

我想看到和更改的RunTest功能和GenTable更改的功能ResultTable,但我不知道如何表达的功能.随着getAnywhere("GenTable")我没有得到我想要的硬代码.

getAnywhere("GenTable")
Run Code Online (Sandbox Code Playgroud)

找到了匹配"GenTable"的单个对象

它在以下地方被发现

package:topGO

namespace:topGO
Run Code Online (Sandbox Code Playgroud)

有价值的

function (object, ...)
standardGeneric("GenTable")
<environment: 0x16a30c10>
attr(,"generic")
[1] "GenTable"
attr(,"generic")attr(,"package")
[1] "topGO"
attr(,"package")
[1] "topGO"
attr(,"group") …
Run Code Online (Sandbox Code Playgroud)

packages r s4

36
推荐指数
2
解决办法
1万
查看次数

为什么我得到"算法没有收敛"和用glm"用数字0或1拟合概率"警告?

所以这是一个非常简单的问题,似乎无法弄明白.

我正在使用glm函数运行logit,但不断收到与自变量相关的警告消息.它们被存储为因素,我已将它们更改为数字,但没有运气.我也将它们编码为0/1,但这也没有用.

请帮忙!

> mod2 <- glm(winorlose1 ~ bid1, family="binomial")
Warning messages:
1: glm.fit: algorithm did not converge 
2: glm.fit: fitted probabilities numerically 0 or 1 occurred 
Run Code Online (Sandbox Code Playgroud)

我也在Zelig尝试过,但类似的错误:

> mod2 = zelig(factor(winorlose1) ~ bid1, data=dat, model="logit")
How to cite this model in Zelig:
Kosuke Imai, Gary King, and Oliva Lau. 2008. "logit: Logistic Regression for Dichotomous Dependent Variables" in Kosuke Imai, Gary King, and Olivia Lau, "Zelig: Everyone's Statistical Software," http://gking.harvard.edu/zelig
Warning messages:
1: glm.fit: algorithm did not converge 
2: …
Run Code Online (Sandbox Code Playgroud)

statistics r r-zelig

33
推荐指数
2
解决办法
6万
查看次数

R中的Cartogram + choropleth地图

我最近一直在使用ggplot2来创建一堆等值线.我想知道是否可以使用ggplot2来创建类似于此的地图(来自WorldMapper):

在此输入图像描述

这是一个等角度,其中shapefile多边形被扭曲以表示相对人口数.我相信这被称为制图.他们用一堆其他变量做到这一点.本着Choropleth R Challenge的精神,有谁知道如何使用R?

r ggplot2 cartogram

33
推荐指数
1
解决办法
6305
查看次数

猫与印花有什么区别?

cat并且print似乎都在提供R的"打印"功能

x <- 'Hello world!\n'
cat(x)
# Hello world!
print(x)
# [1] "Hello world!\n"
Run Code Online (Sandbox Code Playgroud)

我的印象是,cat大多数类似于典型的"打印"功能.我什么时候使用cat,何时使用print

r

33
推荐指数
2
解决办法
3万
查看次数

用R来复制文件

作为在Windows下运行R的大型任务的一部分,我想在目录之间复制选定的文件.是否有可能在R内给出一个命令cp patha/filea*.csv pathb(注意通配符,额外的香料)?

copy r file

31
推荐指数
2
解决办法
2万
查看次数

model.matrix生成的行数少于原始data.frame

为什么模型矩阵必须与数据帧具有相同的行数?

mergem = model.matrix(as.formula(paste(response, '~ .')), data=mergef)
dim(mergef)
# [1] 115562     71
dim(mergem)
# [1] 66786   973
Run Code Online (Sandbox Code Playgroud)

我试图在文档中寻找提示,但找不到任何东西.提前致谢.

model r matrix dataframe

31
推荐指数
1
解决办法
9223
查看次数

如何在R中读取Parquet并将其转换为R DataFrame?

我想用R编程语言处理Apache Parquet文件(在我的例子中,在Spark中生成).

是否有R读卡器?或者正在进行一项工作?

如果没有,那么到达那里最方便的方式是什么?注意:有Java和C++绑定:https://github.com/apache/parquet-mr

r apache-spark parquet sparkr

31
推荐指数
5
解决办法
2万
查看次数

R中的内存分析 - 用于汇总的工具

R有一些内存分析工具,比如 Rprofmem(),Rprof()选项"memory.profiling=TRUE"tracemem().最后一个只能用于对象,因此可以跟踪复制对象的次数,但不提供基于函数的概述.Rprofmem应该能够做到这一点,但即使是最简单的函数调用的输出也会lm()提供超过500行的日志.我试图找出究竟Rprof("somefile.log",memory.profile=T)做了什么,但我不认为我真的明白了.

我能找到的最后一个是托马斯·拉姆利的这个消息,说道,我引述:

我还没有工具来总结输出.

这是在2006年也有一些不错摘要选择现在任何机会,主要是基于Rprofmem(),神秘的输出Rprof()memory.profile设置为TRUE或任何其他工具?

r memory-profiling r-faq

29
推荐指数
1
解决办法
2348
查看次数

在data.table R中使用lapply .SD

我对使用.SD和不太清楚by.

例如,做下面的代码片段意思是:"改变所有的列DT到的因素,除了AB?" 它还在data.table手册中说:" .SDdata.table每个组的子集(不包括分组列)" - 所以列AB排除?

DT = DT[ ,lapply(.SD, as.factor), by=.(A,B)]
Run Code Online (Sandbox Code Playgroud)

但是,我也读过,by当你进行聚合时,这意味着在SQL中使用'group by'.例如,如果我想colsum在除了所有列之外总结(比如在SQL中)A并且B我仍然使用类似的东西吗?或者在这种情况下,下面的代码是否意味着在列AB?中取总和和值组?(A,B在SQL中使用sum和group by )

DT[,lapply(.SD,sum),by=.(A,B)]
Run Code Online (Sandbox Code Playgroud)

然后我如何做colsum除了A和之外的所有列的简单B

r data.table

29
推荐指数
1
解决办法
3万
查看次数

在v1.8.3之前的R {data.table}中使用`:=`时如何抑制输出?

有没有办法防止data.table在通过引用分配新列后打印新的data.table?我收集的标准行为是

library(data.table)
example(data.table)
DT
#    x y  v
# 1: a 1 42
# 2: a 3 42
# 3: a 6 42
# 4: b 1 11
# 5: b 3 11
# 6: b 6 11
# 7: c 1  7
# 8: c 3  8
# 9: c 6  9

DT[,z:=1:nrow(DT)]

#    x y  v z
# 1: a 1 42 1
# 2: a 3 42 2
# 3: a 6 42 3
# …
Run Code Online (Sandbox Code Playgroud)

r data.table

28
推荐指数
1
解决办法
2728
查看次数