每列每 n 行的统计信息

Question

每列每 n 行的统计信息

我想计算每第 n 个（在我的情况下为每 6 个）行（或样本）的均值和标准差。以下函数为我提供了每 6 行的平均值（96 行给了我 16 个平均值）

colMeans(matrix(data.trim$X0, nrow=6))

Run Code Online (Sandbox Code Playgroud)

我想对所有列（总共 1280 个平均值）执行此操作。我尝试运行此功能：

colMeans(matrix(data.trim, nrow=6))

Run Code Online (Sandbox Code Playgroud)

但这根本不起作用，我收到以下错误消息：

colMeans(matrix(data.trim, nrow = 6)) 中的错误：'x' 必须是数字

另外：警告信息：

在 matrix(data.trim, nrow = 6) 中：数据长度 [80] 不是行数 [6] 的约数或倍数

Answer 1

Mat*_*erg 5

您可以使用以下命令将该函数应用于每一列sapply：

sapply(iris[1:4], function(x) colMeans(matrix(x, nrow=6)))
      Sepal.Length Sepal.Width Petal.Length Petal.Width
 [1,]     4.950000    3.383333     1.450000   0.2333333
 [2,]     4.850000    3.316667     1.483333   0.2000000
 [3,]     5.183333    3.633333     1.316667   0.2500000

Run Code Online (Sandbox Code Playgroud)

...

[23,]     6.533333    2.950000     5.583333   1.9333333
[24,]     6.516667    3.033333     5.316667   2.1333333
[25,]     6.383333    3.033333     5.266667   2.1333333

Run Code Online (Sandbox Code Playgroud)

与手动创建前六行的均值进行比较：

colMeans(iris[1:6, 1:4])
Sepal.Length  Sepal.Width Petal.Length  Petal.Width 
   4.9500000    3.3833333    1.4500000    0.2333333

Run Code Online (Sandbox Code Playgroud)

您也可以通过aggregate给定适当的by参数来执行此操作：

aggregate(iris[1:4], by=list((seq(nrow(iris))-1) %/% 6), FUN=mean)
   Group.1 Sepal.Length Sepal.Width Petal.Length Petal.Width
1        0     4.950000    3.383333     1.450000   0.2333333
2        1     4.850000    3.316667     1.483333   0.2000000
3        2     5.183333    3.633333     1.316667   0.2500000

Run Code Online (Sandbox Code Playgroud)

...

这通过创建一个向量来识别要平均的组：

(seq(nrow(iris))-1) %/% 6
  [1]  0  0  0  0  0  0  1  1  1  1  1  1  2  2  2  2  2  2  3  3  3  3  3  3  4  4  4  4  4  4  5  5  5  5  5  5  6  6  6  6  6  6  7  7  7  7  7  7  8  8  8  8
 [53]  8  8  9  9  9  9  9  9 10 10 10 10 10 10 11 11 11 11 11 11 12 12 12 12 12 12 13 13 13 13 13 13 14 14 14 14 14 14 15 15 15 15 15 15 16 16 16 16 16 16 17 17
[105] 17 17 17 17 18 18 18 18 18 18 19 19 19 19 19 19 20 20 20 20 20 20 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 23 24 24 24 24 24 24

Run Code Online (Sandbox Code Playgroud)

该sapply解决方案返回一个矩阵，而该aggregate解决方案返回一个数据帧，以防万一。

归档时间：	11 年，5 月前
查看次数：	8939 次
最近记录：	8 年，4 月前