我试图使用tidyverse和modelr包计算一组数据的逻辑回归预测.显然我做错了,add_predictions因为我没有收到后勤功能的"响应",就像我在统计数据中使用'预测'功能一样.这应该很简单,但我无法弄清楚,多次搜索产生的结果很少.
library(tidyverse)
library(modelr)
options(na.action = na.warn)
library(ISLR)
d <- as_tibble(ISLR::Default)
model <- glm(default ~ balance, data = d, family = binomial)
grid <- d %>% data_grid(balance) %>% add_predictions(model)
ggplot(d, aes(x=balance)) +
geom_point(aes(y = default)) +
geom_line(data = grid, aes(y = pred))
Run Code Online (Sandbox Code Playgroud) 任何人都可以提出关于何时使用map()(所有map _ ..()函数)以及何时使用summarise_at()/ mutate_at()?的建议
例如,如果我们对向量列进行一些修改,那么我们不需要考虑map()?如果我们有一个df /有一个列有一个列表,那么我们需要使用map()?
map()功能是否总是需要与nest()功能一起使用?任何人都可以建议一些关于此的学习视频 还有如何将列表放在df中并同时建模多个列表,然后将模型结果存储在另一列中?
非常感谢!
在我的R环境更新后,我不断收到此错误:
overscope_eval_next(overscope,expr)出错:找不到对象'G'
文档说:"模型.如果提供,模型中不存在的任何预测变量都将填入"典型"值."
这似乎适用于文档中的给定示例.但是,下面给出的例子似乎存在问题.以前的版本没有问题.
library(tidyverse)
library(hexbin)
library(modelr)
smaller <- diamonds %>% filter(carat < 3)
mod_diamond2 <- lm(price ~ carat + color + cut + clarity, data = smaller)
grid <- smaller %>% data_grid(cut, .model = mod_diamond2) %>%
add_predictions(mod_diamond2)
Run Code Online (Sandbox Code Playgroud)
有任何想法吗?提前致谢
我正在按数据集中的组估计回归模型,然后我希望为所有组添加正确的拟合值。
我正在尝试以下操作:
library(dplyr)
library(modelr)
df <- tribble(
~year, ~country, ~value,
2001, "France", 55,
2002, "France", 53,
2003, "France", 31,
2004, "France", 10,
2005, "France", 30,
2006, "France", 37,
2007, "France", 54,
2008, "France", 58,
2009, "France", 50,
2010, "France", 40,
2011, "France", 49,
2001, "USA", 55,
2002, "USA", 53,
2003, "USA", 64,
2004, "USA", 40,
2005, "USA", 30,
2006, "USA", 39,
2007, "USA", 55,
2008, "USA", 53,
2009, "USA", 71,
2010, "USA", 44,
2011, "USA", 40
)
rmod <- df …Run Code Online (Sandbox Code Playgroud) 我有一个长数据集,它由多个插补(假设10个插补)产生的几个数据集组成。它们具有标识插补的id变量。我想在每个这些估算数据集上引导10个数据集。引导程序完成后,我要在每个模型上运行模型(100个插补引导程序组合)。
在此示例中,我不确定是使用该broom::bootstrap()功能还是该modelr::bootstrap()功能。此外,分组似乎在我的管道中丢失了。
这是使用mtcars数据集的可重现示例:
library(tidyverse)
library(broom)
cars <- mtcars %>%
mutate(am = as.factor(am)) %>% # This is standing in for my imputation id variable
group_by(am)
Source: local data frame [32 x 11]
Groups: am [2]
# A tibble: 32 x 11
mpg cyl disp hp drat wt qsec vs am gear carb
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <fctr> <dbl> <dbl>
1 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
2 21.0 …Run Code Online (Sandbox Code Playgroud)