小编Ray*_*oro的帖子

lm 中因子的奇怪名称

我正在使用来自包鼠标的男孩数据集的数据。当我对其中一个因子变量 (phb) 运行回归时，输出会显示这些因子，但给它们的名称与数据中的名称不同。我想知道为什么会这样。有没有办法纠正它？

library(mice)
data(boys)
# phb is already an ordered factor
table(boys$phb)

P1 P2 P3 P4 P5 P6 
63 40 19 32 50 41 

>summary(lm(age~factor(phb),data=boys))

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)   14.22660    0.09610 148.033   <2e-16 ***
factor(phb).L  6.24873    0.20493  30.492   <2e-16 ***
factor(phb).Q  0.06451    0.23668   0.273    0.785    
factor(phb).C  0.10205    0.22300   0.458    0.648    
factor(phb)^4 -0.12415    0.23413  -0.530    0.596    
factor(phb)^5 -0.12713    0.27299  -0.466    0.642

Run Code Online (Sandbox Code Playgroud)

所以，我的问题是为什么它输出 .L、.Q、.C、^4、^5？我做了一些研究，这似乎代表线性、二次、三次。为什么会这样？我只是希望它是因子（phb）。P1 等。

regression r categorical-data

Ray*_*oro

lucky-day

5
推荐指数

1
解决办法

2109
查看次数

使用向量而不是 R 中的正则表达式从字符串中删除多个单词

我想从 R 中的字符串中删除多个单词，但想使用字符向量而不是正则表达式。

例如，如果我有字符串

"hello how are you"

Run Code Online (Sandbox Code Playgroud)

并想删除

c("hello", "how")

Run Code Online (Sandbox Code Playgroud)

我会回来

" are you"

Run Code Online (Sandbox Code Playgroud)

我可以近距离接触str_remove()来自stringr

"hello how are you" %>% str_remove(c("hello","how"))
[1]  "how are you"   "hello  are you"

Run Code Online (Sandbox Code Playgroud)

但我需要做一些事情来将其分解为一个字符串。是否有一个函数可以一次调用完成所有这些操作？

string r vector stringr

Ray*_*oro

2019 05-11

4
推荐指数

1
解决办法

4187
查看次数

标签统计

r ×2

categorical-data ×1

regression ×1

string ×1

stringr ×1

vector ×1

lm 中因子的奇怪名称

使用向量而不是 R 中的正则表达式从字符串中删除多个单词

标签 统计

小编Ray_oro的帖子

标签统计