朱莉娅的虚拟变量

Rob*_*lly 7 dataframe glm julia

在R中,对于分类变量的每个级别,使用虚拟变量运行回归具有很好的功能.例如,自动将R因子扩展为每个因子级别的1/0指标变量的集合

在朱莉娅有没有相同的方法来做到这一点.

x = randn(1000)
group = repmat(1:25 , 40)
groupMeans = randn(25)
y = 3*x + groupMeans[group]

data = DataFrame(x=x, y=y, g=group)
for i in levels(group)
    data[parse("I$i")] = data[:g] .== i
end
lm(y~x+I1+I2+I3+I4+I5+I6+I7+I8+I9+I10+
    I11+I12+I13+I14+I15+I16+I17+I18+I19+I20+
    I21+I22+I23+I24, data)
Run Code Online (Sandbox Code Playgroud)

ntd*_*def 4

如果您使用 DataFrames 包,那么在您输入pool数据之后,该包将处理其余的事情:

池化列对于使用 GLM 包非常重要 在拟合回归模型时,输入中的 PooledDataArray 列将转换为 ModelMatrix 中的 0/1 指示符列 - PooledDataArray 的每个级别对应一列。

您可以在此处查看有关汇总数据的其余文档