我有这些循环:
xall = data.frame()
for (k in 1:nrow(VectClasses))
{
for (i in 1:nrow(VectIndVar))
{
xall[i,k] = sum(VectClasses[k,] == VectIndVar[i,])
}
}
Run Code Online (Sandbox Code Playgroud)
数据:
VectClasses =包含每个类别特征的数据框
VectIndVar =包含数据库的每个记录的数据框
这两个for循环可以工作并提供我可以使用的输出,但是,这花费的时间太长,因此我需要Apply系列
我正在寻找的输出是这样的:
V1 V2 V3 V4
1 3 3 2 2
2 2 2 1 1
3 3 4 3 3
4 3 4 3 3
5 4 4 3 3
6 3 2 3 3
Run Code Online (Sandbox Code Playgroud)
我尝试使用:
xball = data.frame()
xball = sapply(xball, function (i,k){
sum(VectClasses[k,] == VectIndVar[i,])})
xcall = data.frame()
xcall = lapply(xcall, function (i, k){sum(VectClasses[k,] == VectIndVar[i,]} )
Run Code Online (Sandbox Code Playgroud)
但似乎都没有填充数据框
生殖数据(缩短):
VectIndVar <- data.frame(a=sample(letters[1:5], 100, rep=T), b=floor(runif(100)*25),
c = sample(c(1:5), 100, rep=T),
d=sample(c(1:2), 100, rep=T))
Run Code Online (Sandbox Code Playgroud)
和:
> K1 = 4
VectClasses= VectIndVar [sample(1:nrow(VectIndVar ), K1, replace=FALSE), ]
Run Code Online (Sandbox Code Playgroud)
你能帮助我吗?
我会使用outer而不是*apply:
res <- outer(
1:nrow(VectIndVar),
1:nrow(VectClasses),
Vectorize(function(i,k) sum(VectIndVar[i,-1]==VectClasses[k,-1]))
)
Run Code Online (Sandbox Code Playgroud)
(感谢此问答,以澄清Vectorize需要的内容。)
这给
> head(res) # with set.seed(1) before creating the data
[,1] [,2] [,3] [,4]
[1,] 1 1 2 1
[2,] 0 0 1 0
[3,] 0 0 0 0
[4,] 0 0 1 0
[5,] 1 0 0 1
[6,] 1 1 1 1
Run Code Online (Sandbox Code Playgroud)
至于速度,我建议使用矩阵而不是data.frames:
cmat <- as.matrix(VectClasses[-1]); rownames(cmat)<-VectClasses$a
imat <- as.matrix(VectIndVar[-1]); rownames(imat)<-VectIndVar$a
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
2144 次 |
| 最近记录: |