小编Har*_*y15的帖子

在R中提取回归P值

我在查询文件中的不同列上执行多次回归.我的任务是从R中的回归函数lm中提取某些结果.

到目前为止,我有,

> reg <- lm(query$y1 ~ query$x1 + query$x2)
> summary(reg)

Call:
lm(formula = query$y1 ~ query$x1 + query$x2)

Residuals:
    1     2     3     4 
  7.68 -4.48 -7.04  3.84 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)  1287.26     685.75   1.877    0.312
query$x1      -29.30      20.92  -1.400    0.395
query$x2     -116.90      45.79  -2.553    0.238

Residual standard error: 11.97 on 1 degrees of freedom
Multiple R-squared:  0.9233,    Adjusted R-squared:  0.7699 
F-statistic: 6.019 on 2 and 1 DF,  p-value: 0.277

Run Code Online (Sandbox Code Playgroud)

要提取系数,r平方和F统计,我使用以下内容:

reg$coefficients
summary(reg)$r.squared
summary(reg)$fstatistic

Run Code Online (Sandbox Code Playgroud)

我想提取0.2值的p值. …

r linear-regression p-value

Har*_*y15

lucky-day

8
推荐指数

3
解决办法

1万
查看次数

如何在R中将csv转换为shp

在过去的几天里,我一直在尝试将csv转换为shapefile.我知道我可以在QGIS或Arc中轻松完成,但是想将此过程添加到我现有的R代码中.

所以我可以在csv中读到没有任何问题

MyData <- read.csv(file="c:/TheDataIWantToReadIn.csv", header=TRUE, sep=",")

Run Code Online (Sandbox Code Playgroud)

我在Packages Shapefile帮助指南中找到了以下代码.但是,我似乎无法找到一种方法来处理我的代码.我的行都是一个点,因此我想创建的shapefile将是所有点.我没有Id列,但是我在两个单独的列中有x和y数据.

dd <- data.frame(Id=c(1,2),X=c(3,5),Y=c(9,6))
ddTable <- data.frame(Id=c(1,2),Name=c("Item1","Item2"))
ddShapefile <- convert.to.shapefile(dd, ddTable, "Id", 1)
write.shapefile(ddShapefile, "c:/test", arcgis=T)

Run Code Online (Sandbox Code Playgroud)

任何帮助将不胜感激.

csv r shapefile dataframe

Har*_*y15

2015 05-08

2
推荐指数

1
解决办法

9667
查看次数

提取数据框中的重复记录

我有一个data frame我想选择具有重复值的两行。在下面的示例中，我想要一个新的数据框或两个单独的数据框，其中两条记录分别为 19 和 32。

        a <- c(8, 18, 19, 19, 20, 30, 32, 32, 58)
        b <- c(1950, 1965, 1971, 1981, 1999, 1969, 1994, 1985)
        df <- data.frame(a,b)    
        df
        a    b
        1  8 1950
        2 18 1965
        3 19 1971
        4 19 1981
        5 20 1999
        6 30 1969
        7 32 1994
        8 32 1999
        9 58 1985

Run Code Online (Sandbox Code Playgroud)

我试过使用，df[duplicated(df$a), ]但这只会提取重复的第二条记录，我想要这两条记录。最终目标是减去 19 和 32 这两个记录之间第二列中的年份。

r dataframe

Har*_*y15

2016 03-08

2
推荐指数

1
解决办法

6878
查看次数

从列表中导出多元回归的摘要

我有一个使用标准数据集通过此代码完成的多重回归列表mtcars。

models <- lapply(paste("mpg", names(mtcars)[-1], sep = "~"), formula)
res.models <- lapply(models, FUN = function(x) {summary(lm(formula = x, data = mtcars))})
names(res.models) <- paste("mpg", names(mtcars)[-1], sep = "~")

Run Code Online (Sandbox Code Playgroud)

我现在有一个针对第一列“mpg”的多重回归列表。从这里我试图导出某些汇总统计信息，例如；截距、系数和 r.squared。

我尝试使用下面包含的循环。

for (i in 1:length(res.models))
{
  res <- res.models[[i]]
  res_bound <- NULL
  intercept <- res$coefficients[1]
  coef <- res$coefficients[2]
  r <- res$r.squared
  res_bound <- cbind(intercept, coef, r)
}

Run Code Online (Sandbox Code Playgroud)

虽然这让我得到了dataframe它只包括最后一个回归模型的结果，一个 1 row x 3 column dataframe。此外，我想在表中包含每个回归的“术语”，以区分我正在查看的模型（例如 mpg 与 cyl 或 mpg 与 hp）。

我只是在循环中遗漏了一个步骤吗？最终的目标是write.csv决赛dataframe …

regression r lm

Har*_*y15

lucky-day

1
推荐指数

1
解决办法

1747
查看次数