我有一个数值列表,我需要计算一个新列表,该列表将由原始列表中每两个连续元素的差值组成。我有这个代码:
wss <- (nrow(dat)-1)*sum(apply(dat,2,var))
for (i in 2:15) wss[i] <- sum(kmeans(dat,
centers=i)$withinss)
plot(1:15, wss, type="b", xlab="Number of Clusters",
ylab="Within groups sum of squares")
# choose optimal k where sos derivative is large for the first time
diff <- lapply(wss, diff)
Run Code Online (Sandbox Code Playgroud)
所以我原来的列表是 wss
> dput(wss)
c(4155212952468.46, 4021505707879.36, 4017356406677.14, 4015231535838.63,
4013350949497.91, 17067610483.738, 17023281391.9182, 4013258218594.64,
14454798910.9291, 16989216167.6064, 14860266330.575, 14480295584.8302,
14506662229.3596, 14289181733.1553, 14283121461.9347)
Run Code Online (Sandbox Code Playgroud)
在结果列表中,我预计第一个元素将是 4155212952468.46 - 4021505707879.36 第二个元素将是 4021505707879.36 - 4017356406677.14 等等任何帮助表示赞赏
你可以简单地使用
diff(wss)
Run Code Online (Sandbox Code Playgroud)
它返回差异向量。
为了说明你做错了什么。lapply 应该在列表上使用,并为列表中的每个元素计算函数。这在这里不适用,因为:i)您没有列表,ii)您需要两个连续元素之间的差异,并且在您使用的方法中,即使它是一个列表,您也只向函数 diff 提供一个
| 归档时间: |
|
| 查看次数: |
3835 次 |
| 最近记录: |