是否有一种简单的方法在linux中为单个用户安装程序.我只需要为我的登录安装Biopython.我没有系统的root权限.
我使用了这里给出的配方取得了很大的成功.但是,过去几天这似乎不起作用.我sessionInfo()看起来如下:
R version 2.15.2 (2012-10-26)
Platform: x86_64-apple-darwin9.8.0/x86_64 (64-bit)
locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
attached base packages:
[1] grid stats graphics grDevices utils datasets methods base
other attached packages:
[1] VennDiagram_1.5.1
loaded via a namespace (and not attached):
[1] tools_2.15.2
Run Code Online (Sandbox Code Playgroud)
我尝试了以下,并没有产生任何结果:
require(VennDiagram)
venn.diagram(list(B = 1:1800, A = 1571:2020),fill = c("red", "green"), alpha = c(0.5, 0.5), cex = 2,cat.fontface = 4,lty =2, fontfamily =3, filename = "trial2.emf")
Run Code Online (Sandbox Code Playgroud)
但没有产生任何结果.
我做错了吗?
我有一个大约 1.25 亿行的巨大坐标文件。我想对这些线条进行采样以获得所有线条的 1%,以便我可以绘制它们。有没有办法在R中做到这一点?文件很简单,只有3列,我只对前两列感兴趣。该文件的示例如下:
1211 2234
1233 2348
.
.
.
Run Code Online (Sandbox Code Playgroud)
任何帮助/指针都受到高度赞赏。
如果这是一个重复的问题,我很抱歉.如何编写python脚本来处理数据流?我需要这样做,因为我正在处理的文件很大,我宁愿不把文件读入内存.
我知道你可以一次读取一行文件,但我想要一些能处理文本流的东西.
可能重复:
根据范围在R中创建分类变量
给定期望的范围和数量的间隔我如何创建相等的间隔R.例如.如果范围在1和100之间,并且我想创建10个间隔,我应该得到1 - 10,11 - 20,......,91 - 100.只有这个函数应该适用于任何范围和任意数量的间隔.如果我的范围为0到1且间隔数为30,那么它应该创建范围,例如0 - 0.03,...,0.97 - 1,依此类推.目的是使用这些范围从data.frame获取值.
在处理问题时,我发现了一些有趣的东西.我不知道到底发生了什么,但有些事情发生了,我没想到会发生.我可能犯了一个错误,但让我先举一个例子:
x <- rnorm( 100 )
y <- x[ x > quantile( x, 0.1 ) ]
z <- x[ x > quantile( x, c( 0.1, 0.2 ) ) ]
a <- x[ x > quantile( x, c( 0.1, 0.2, 0.3 ) ) ]
Run Code Online (Sandbox Code Playgroud)
我们得到三个不同的结果,但是如何解释这些结果.这些是使用的限制吗?
更新:我想我问的是错误的问题.我们如何解释以下内容:
> x <- rnorm( 100 )
> length( x[ x > quantile( x, 0.1 ) ] )
[1] 90
> length( x[ x > quantile( x, 0.2 ) ] )
[1] 80
> length( x[ …Run Code Online (Sandbox Code Playgroud) 我有一个内部python使用的脚本rpy2.这个脚本一直工作到最近.但是,它现在停止了工作.我收到了一个我以前没见过的错误.我可以使用以下代码行重现错误:
$ python
Python 2.6.1 (r261:67515, Jun 24 2010, 21:47:49)
[GCC 4.2.1 (Apple Inc. build 5646)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import rpy2.robjects as robjects
cannot find system Renviron
Error in getLoadedDLLs() : there is no .Internal function 'getLoadedDLLs'
Error in checkConflicts(value) :
".isMethodsDispatchOn" is not a BUILTIN function
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/Library/Python/2.6/site-packages/rpy2-2.2.5dev_20120328-py2.6-macosx-10.6- universal.egg/rpy2/robjects/__init__.py", line 17, in <module>
from rpy2.robjects.robject …Run Code Online (Sandbox Code Playgroud) 我有多个列表.我需要找到一种方法来生成每个列表中的唯一项目列表,与所有列表进行比较.有没有简单或直接的方法来做到这一点.我知道这些列表基本上可以用作sets.
这是Stack Exchange统计部分的转发.我曾在那里问过这个问题,我建议在这里提出这个问题.所以这就是.
我有一个数据框列表.每个数据帧具有类似的结构.每个数据框中只有一列是数字的.由于我的数据要求,每个数据帧的长度必须不同.我想创建一个数值的箱线图,按照另一列中的属性进行分类.但是箱线图应该包括来自所有数据帧的信息.
我希望这是一个明确的问题.我会尽快发布样本数据.
我正在使用table命令生成两个表R.我想创建一个表/数据帧/矩阵,以便表示两个表中的所有名称,并在输出中包含正确的"零"计数.例如
我目前的数据看起来如下
表格1
A B C
1 2 4
Run Code Online (Sandbox Code Playgroud)
表2
C D E
3 4 4
Run Code Online (Sandbox Code Playgroud)
我想要输出如下:
Table1 Table2
A 1 0
B 2 0
C 4 3
D 0 4
E 0 4
Run Code Online (Sandbox Code Playgroud)
我怎么能在R中这样做?
我有一个带有16个字段的制表符分隔文件.我可以使用awk有条件地改变一个或多个字段并打印整行作为输出吗?例如,根据第一个字段中的值,我想说一个特定的数字添加到字段4,依此类推.但作为输出我必须打印整行.如果是的话,我想知道如何.
r ×7
python ×3
dataframe ×2
list ×2
awk ×1
ggplot2 ×1
inputstream ×1
installation ×1
large-files ×1
linux ×1
quantile ×1
range ×1
rpy2 ×1
sampling ×1
set ×1
unique ×1
venn-diagram ×1