在读入R之前,您应该使用其他工具预处理文件.
要将每1000行写入新文件,可以使用sed,如下所示:
sed -n '0~1000p' infile > outfile
Run Code Online (Sandbox Code Playgroud)
然后将新文件读入R:
datasets <- read.table("outfile", sep = "\t", header = F)
Run Code Online (Sandbox Code Playgroud)
您可能希望查看专门用于R数据导入/导出的手册.
天真的方法总是加载所有数据.你不希望这样.您可能需要另一个逐行读取的脚本(用awk,perl,python,C,......编写)并且只发出每第N行.然后,您可以通过管道直接在R中读取该程序的输出 - 请参阅Connections上的帮助.
一般来说,非常大的内存设置需要对R有所了解.耐心等待,你会得到这个,但是再一次,一个天真的方法需要大量的RAM和64位操作系统.
| 归档时间: |
|
| 查看次数: |
4547 次 |
| 最近记录: |