小编Ray*_*oro的帖子

lm 中因子的奇怪名称

我正在使用来自包鼠标的男孩数据集的数据。当我对其中一个因子变量 (phb) 运行回归时,输出会显示这些因子,但给它们的名称与数据中的名称不同。我想知道为什么会这样。有没有办法纠正它?

library(mice)
data(boys)
# phb is already an ordered factor
table(boys$phb)

P1 P2 P3 P4 P5 P6 
63 40 19 32 50 41 

>summary(lm(age~factor(phb),data=boys))

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)   14.22660    0.09610 148.033   <2e-16 ***
factor(phb).L  6.24873    0.20493  30.492   <2e-16 ***
factor(phb).Q  0.06451    0.23668   0.273    0.785    
factor(phb).C  0.10205    0.22300   0.458    0.648    
factor(phb)^4 -0.12415    0.23413  -0.530    0.596    
factor(phb)^5 -0.12713    0.27299  -0.466    0.642    
Run Code Online (Sandbox Code Playgroud)

所以,我的问题是为什么它输出 .L、.Q、.C、^4、^5?我做了一些研究,这似乎代表线性、二次、三次。为什么会这样?我只是希望它是因子(phb)。P1 等。

regression r categorical-data

5
推荐指数
1
解决办法
2109
查看次数

使用向量而不是 R 中的正则表达式从字符串中删除多个单词

我想从 R 中的字符串中删除多个单词,但想使用字符向量而不是正则表达式。

例如,如果我有字符串

"hello how are you" 
Run Code Online (Sandbox Code Playgroud)

并想删除

c("hello", "how")
Run Code Online (Sandbox Code Playgroud)

我会回来

" are you"
Run Code Online (Sandbox Code Playgroud)

我可以近距离接触str_remove()来自stringr

"hello how are you" %>% str_remove(c("hello","how"))
[1]  "how are you"   "hello  are you"
Run Code Online (Sandbox Code Playgroud)

但我需要做一些事情来将其分解为一个字符串。是否有一个函数可以一次调用完成所有这些操作?

string r vector stringr

4
推荐指数
1
解决办法
4187
查看次数

标签 统计

r ×2

categorical-data ×1

regression ×1

string ×1

stringr ×1

vector ×1