我有一个data.frame
,我想写出来.我的尺寸data.frame
是256行乘65536列.什么是更快的替代品write.csv
?
我在R中有一个矩阵变量,比如k.我想把它写成文件.我使用的代码如下:
write.table(k,file="outfile",sep="\t")
Run Code Online (Sandbox Code Playgroud)
但是当我获取文件并打开它时,它包含标题.第一行是:"v1""v2"......"V6000".之后,每行以行号开头,如"1","2"等.我不想要标题.有没有办法做到这一点?
现在我甚至无法再将文件加载到R中read.table("outfile",header=TRUE,sep= "\t")
,它甚至与我之前输出的文件不一样.R识别文件中的第一个colunm,它是行号作为新列.
我正在尝试将armadillo库安装到我的linux系统(ubuntu 12.04)上.首先需要BOOST BLAS ATLAS和LAPACK进行安装.有没有办法检查这些库是否已经安装?
我有一个数据集,其中一个列有因子级别"a" "b" "c" "NotPerformed"
.如何将所有"NotPerformed"
因素更改为NA?
我的R脚本调用包含set.seed()的子函数.set.seed()的范围是什么?它会影响调用它的主程序吗?
更具体地说
# main program
callsubfun()
... some statement ...
sample.int(100,20)
# sub function
callsubfun <- function(x,y,...){
set.seed(100)
... do the work ...
return(something)
}
Run Code Online (Sandbox Code Playgroud) 我有一个数据框存储拥有不同种类的不同种类的水果.如下
apple banana orange
Tim 3 0 2
Tom 0 1 1
Bob 1 2 2
Run Code Online (Sandbox Code Playgroud)
同样,数字是水果的数量.如何将其更改为存在矩阵,这意味着如果一个人有一个水果,无论他有多少,那么我记录1,如果没有,记录0.如下
apple banana orange
Tim 1 0 1
Tom 0 1 1
Bob 1 1 1
Run Code Online (Sandbox Code Playgroud) 现在使用R,我的记忆几乎已满(已经应用了gc()).有没有办法知道每个变量的内存消耗,以便我知道哪一个占用最多的内存并删除那个.
我有多个文件在不同的目录下具有相似的名称.该目录的命名方式类似于:dir1 - > dir10.
在每个目录下都有名为f1-f10的文件,我想读取每个目录中的第一个文件.
我可以使用read.csv吗?因为我需要使用变量来表示目录和文件名.
当我在linux下测试一个perl脚本并time sh -c
用来衡量花费的时间时,我得到了一个奇怪的结果:
real 14m11.903s
user 34m39.319s
sys 16m54.074s
Run Code Online (Sandbox Code Playgroud)
这意味着实际花费的时间甚至比用户时间还少.并且在视觉上自己计算时间,脚本没有花费多达34分钟,实时更接近我所看到的.有没有人对此有任何线索?谢谢.
有没有办法在R中使用plot3d(rgl)构建一个三维图形时显示名称,因此当我有多个球体在同一坐标上绘制时,很难找到球体属于哪个条目.例如,我有数据:
x y z
A 0.1 -0.5 3.2
B -1.1 1.2 0.8
C 2.0 2.1 0.6
......
plot3d(data,type="s",radius=0.025)
Run Code Online (Sandbox Code Playgroud)
但是,我想在图表上显示名称A,B,C,因为它更容易观察.或者只有当我将鼠标放在一个特定的球体上时才显示名称.我试图使用不同的颜色,但是当我有20个球体时,它似乎会用尽颜色或颜色太接近而无法辨别.