Dou*_*Fir 0 r function dataframe
通过R教程,我很难理解.
目录是包含大量csv文件的文件夹.该函数将id作为一个或多个文件的id,并返回每个文件中的记录数.
我的功能:
complete <- function(directory,id = 1:332) {
csvfiles <- sprintf("/Users/myname/Desktop/%s/%03d.csv", directory, id)
nrows <- sapply( csvfiles, function(f) nrow(read.csv(f)))
data.frame(ID=sprintf('%03d', id),
countrows=sapply(csvfiles,function(x) length(count.fields(x))),
row.names=id
)
}
Run Code Online (Sandbox Code Playgroud)
然后完成("specdata",100:105)返回
ID countrows
100 100 1097
101 101 731
102 102 1462
103 103 3653
104 104 2558
105 105 2192
Run Code Online (Sandbox Code Playgroud)
我必须做什么才能使最左边的列是从1开始的序列?因此,例如,第一个记录是1 100和1092,第二个记录是2 101和731
第一个明显的列只是行的名称(例如看ncol(specdata)).您可以按如下方式重命名行:
row.names(specdata) <- 1:nrow(specdata)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
670 次 |
| 最近记录: |