我在查询文件中的不同列上执行多次回归.我的任务是从R中的回归函数lm中提取某些结果.
到目前为止,我有,
> reg <- lm(query$y1 ~ query$x1 + query$x2)
> summary(reg)
Call:
lm(formula = query$y1 ~ query$x1 + query$x2)
Residuals:
1 2 3 4
7.68 -4.48 -7.04 3.84
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1287.26 685.75 1.877 0.312
query$x1 -29.30 20.92 -1.400 0.395
query$x2 -116.90 45.79 -2.553 0.238
Residual standard error: 11.97 on 1 degrees of freedom
Multiple R-squared: 0.9233, Adjusted R-squared: 0.7699
F-statistic: 6.019 on 2 and 1 DF, p-value: 0.277
Run Code Online (Sandbox Code Playgroud)
要提取系数,r平方和F统计,我使用以下内容:
reg$coefficients
summary(reg)$r.squared
summary(reg)$fstatistic
Run Code Online (Sandbox Code Playgroud)
我想提取0.2值的p值. …
在过去的几天里,我一直在尝试将csv转换为shapefile.我知道我可以在QGIS或Arc中轻松完成,但是想将此过程添加到我现有的R代码中.
所以我可以在csv中读到没有任何问题
MyData <- read.csv(file="c:/TheDataIWantToReadIn.csv", header=TRUE, sep=",")
Run Code Online (Sandbox Code Playgroud)
我在Packages Shapefile帮助指南中找到了以下代码.但是,我似乎无法找到一种方法来处理我的代码.我的行都是一个点,因此我想创建的shapefile将是所有点.我没有Id列,但是我在两个单独的列中有x和y数据.
dd <- data.frame(Id=c(1,2),X=c(3,5),Y=c(9,6))
ddTable <- data.frame(Id=c(1,2),Name=c("Item1","Item2"))
ddShapefile <- convert.to.shapefile(dd, ddTable, "Id", 1)
write.shapefile(ddShapefile, "c:/test", arcgis=T)
Run Code Online (Sandbox Code Playgroud)
任何帮助将不胜感激.
我有一个data frame我想选择具有重复值的两行。在下面的示例中,我想要一个新的数据框或两个单独的数据框,其中两条记录分别为 19 和 32。
a <- c(8, 18, 19, 19, 20, 30, 32, 32, 58)
b <- c(1950, 1965, 1971, 1981, 1999, 1969, 1994, 1985)
df <- data.frame(a,b)
df
a b
1 8 1950
2 18 1965
3 19 1971
4 19 1981
5 20 1999
6 30 1969
7 32 1994
8 32 1999
9 58 1985
Run Code Online (Sandbox Code Playgroud)
我试过使用,df[duplicated(df$a), ]但这只会提取重复的第二条记录,我想要这两条记录。最终目标是减去 19 和 32 这两个记录之间第二列中的年份。
我有一个使用标准数据集通过此代码完成的多重回归列表mtcars。
models <- lapply(paste("mpg", names(mtcars)[-1], sep = "~"), formula)
res.models <- lapply(models, FUN = function(x) {summary(lm(formula = x, data = mtcars))})
names(res.models) <- paste("mpg", names(mtcars)[-1], sep = "~")
Run Code Online (Sandbox Code Playgroud)
我现在有一个针对第一列“mpg”的多重回归列表。从这里我试图导出某些汇总统计信息,例如;截距、系数和 r.squared。
我尝试使用下面包含的循环。
for (i in 1:length(res.models))
{
res <- res.models[[i]]
res_bound <- NULL
intercept <- res$coefficients[1]
coef <- res$coefficients[2]
r <- res$r.squared
res_bound <- cbind(intercept, coef, r)
}
Run Code Online (Sandbox Code Playgroud)
虽然这让我得到了dataframe它只包括最后一个回归模型的结果,一个 1 row x 3 column dataframe。此外,我想在表中包含每个回归的“术语”,以区分我正在查看的模型(例如 mpg 与 cyl 或 mpg 与 hp)。
我只是在循环中遗漏了一个步骤吗?最终的目标是write.csv决赛dataframe …