我想这dplyr不仅仅是一个plyr问题.为了速度,我使用的data.table是一些我编写过的代码.在中间步骤中,我有一个表格,其中包含一些基因组数据,大约有32,000行:
> bedbin.dt
Source: local data table [32,138 x 4]
Groups: chr
bin start site chr
1 2 3500000 ssCTCF 1
2 3 4000000 ssCTCF+Cohesin 1
3 3 4000000 ssCTCF 1
4 4 4500000 ucCTCF 1
5 4 4500000 ssCTCF+Cohesin 1
6 4 4500000 ssCTCF+Cohesin 1
7 4 4500000 ssCTCF+Cohesin 1
8 4 4500000 ssCTCF 1
9 4 4500000 ssCTCF 1
10 5 5000000 ssCTCF 1
.. ... ... ... ...
Run Code Online (Sandbox Code Playgroud)
编辑
或者像这样的前100行数据(请向Ricardo Saporta索取说明) …