标签: statistics-bootstrap

用于在R中以矩阵形式生成自举样本的快速函数

我有一个矩阵A,我想从每一列中抽取样本A并构建新的矩阵.例如:

A = matrix(seq(1,9),3,3)

因此,为了获得第一个自举矩阵,我将从第一列(A即1,2,3)中替换(3次),从第二列(A即4,5,6 )替换(3次),并从第三列(A即7,8,9 )替换(3次)样品.之后,我通过组合三个自举向量重新构建第一个自举矩阵B1.我将重复此过程B = 199次,以便引导矩阵B1,...,B199可用.

我的问题是,如何让这个程序运行得更快?我应该使用哪种功能?我知道apply涉及基本上for循环所以速度不能保证.怎么样do.call?谢谢!

r statistics-bootstrap

2
推荐指数
1
解决办法
1650
查看次数

boot.ci()返回bootstrap样本的奇怪置信区间

我有两组正实数.

> dput(group1)
c(2.10753, 2.57251, 2.61687, 4.62551, 7.13166, 6347.63, 4.22139, 
10.7373, 2.11568, 2.71866, 4.09376, 10.9046, 109807, 5.87156, 
3.17082, 3.4703, 2.47262, 9.24319, 34.6945, 5.72567, 12.0134, 
108.33, 6.60707, 6.24304, 3.59048, 10.3174, 48.0265, 5.32097, 
3.77157, 6.67401, 22.633, 34.8186, 21.5315, 9.42882, 7.10627, ...)

> dput(group2)
c(4.88474, 65.4318, 128.101, 24.1271, 5.44262, 54.8987, 2.85175, 
14.1089, 172.23, 66.8563, 6.74067, 2.19603, 2.12985, 4.12735,
16.401, 3.22688, 15.6943, 4.32861, 36.4752, 7.33769, 75.855, 
62.7653, 35.1786, 3.71099, 29.0186, 34.4472, 19.1061, 2.75174, ...)
Run Code Online (Sandbox Code Playgroud)

Group1由~1000个值组成,组2为~30,000.我对两组之间的中位数感兴趣,并使用以下R函数计算每个2000引导样本的这个比率(对于boot()命令,请参阅下面的函数输出):

medianRatio <- function(x, i, noGroup1, noGroup2) {
    all <- …
Run Code Online (Sandbox Code Playgroud)

r confidence-interval statistics-bootstrap

1
推荐指数
1
解决办法
5862
查看次数

model.frame.default 中的错误...可变长度在 R 中不同线性模型验证

我正在尝试使用引导包中的函数 cv.glm() 来验证线性模型。首先我运行模型,它工作正常:

> linear_model_red<-glm(red_wine_data$quality~.,data=red_wine_data)
Run Code Online (Sandbox Code Playgroud)

然后,我想做验证:

cv.glm(red_wine_data,linear_model_red)
Run Code Online (Sandbox Code Playgroud)

它给我带来了错误:

Error in model.frame.default(formula = red_wine_data$quality ~ ., data = list( : 
  variable lengths differ (found for 'fixed acidity')
Run Code Online (Sandbox Code Playgroud)

我根本没有任何丢失的数据,我检查过。而且我所有的变量都是相同的长度:

sapply(red_wine_data,function(x) length(x))
           fixed acidity             volatile acidity 
                    1599                         1599 
             citric acid               residual sugar 
                    1599                         1599 
               chlorides          free sulfur dioxide 
                    1599                         1599 
    total sulfur dioxide                      density 
                    1599                         1599 
                      pH                    sulphates 
                    1599                         1599 
                 alcohol                      quality 
                    1599                         1599 
volatile acidity*citric acid   volatile acidity*sulphates 
                        1599                         1599 
    volatile acidity*alcohol        citric acid*sulphates 
                        1599                         1599 
         citric acid*alcohol            sulphates*alcohol 
                        1599                         1599 
Run Code Online (Sandbox Code Playgroud)

请帮忙!

validation r statistics-bootstrap

0
推荐指数
1
解决办法
1万
查看次数

在R.中进行Deming回归时间敏感

我只是将R加载到我的Windows机器中,并包含引导程序和Deming回归的mcr例程.非常基本的问题.

  1. 如何在自举采样程序中嵌入Deming回归?

  2. 如何将数据输入R?数据位于Excel电子表格中.

请尽快给我一个快速的方法.我想尽可能今天这样做!

packages r statistics-bootstrap

-2
推荐指数
1
解决办法
1322
查看次数