所以我有三个数据框,每个数据框有 14 列。
iowa <- data.frame() #Has 14 columns; let's say 600 records
maine <- data.frame() #Has same 14 columns; let's say 700 records
texas <- data.frame() #Has same 14 columns; let's say 900 records
Run Code Online (Sandbox Code Playgroud)
我将这些数据框放在一个列表中,
state_List <- list(iowa, maine, texas)
Run Code Online (Sandbox Code Playgroud)
然后,我想将 state_List 内每个数据帧内的两列(称为“State_Date”和“US_Date”)更改为日期格式,并且我想更改除一列之外的所有列作为因子。我写了以下内容:
state_List <- lapply(state_List,
function(x){
x$State_Date <- as.Date(x$State_Date, format = "%m/%d/%Y")
x$US_Date <- as.Date(x$US_Date, format = "%m/%d/%Y")
x[, c(1:7, 9:14)] <- as.factor(x[, c(1:7, 9:14)]
}
)
Run Code Online (Sandbox Code Playgroud)
我收到的错误是
Error in sort.list(y) : 'x' must be atomic for 'sort.list'
Have you called 'sort' on a list?
Run Code Online (Sandbox Code Playgroud)
此错误是由于 as.factor 部分造成的。
但是,如果我去掉 lapply 中调用的函数的最后一次求值,只保留两个更改日期字段类的函数,我得到的是:
我想要的是:
感谢您的帮助!
* *下面的正确代码显示了我应该根据响应做什么:
state_List <- list(iowa = iowa, maine = maine, texas = texas)
state_List <- lapply(state_List,
function(X){
x$State_Date <- as.Date(x$State_Date, format = "%m/%d/%Y")
x$US_Date <- as.Date(x$US_Date, format = "%m/%d/%Y")
x[, c(1:7, 9:14)] <- lapply( x[, c(1:7, 9:14)] , factor)
return(x)
}
)
Run Code Online (Sandbox Code Playgroud)
该函数内的第三行应该是:
x[, c(1:7, 9:14)] <- lapply( x[, c(1:7, 9:14)] , factor)
Run Code Online (Sandbox Code Playgroud)
你应该return(x)
在最后。