如果我在数据集中有一个包含多个变量的列,我将如何创建这些虚拟变量.
示例:假设我有一个名为color的列:红色,绿色,黄色,蓝色,粉红色和灰色作为汽车颜色的选项.
将这些变量转化为因子的最佳方法是什么.没有手工创建一堆虚拟变量?
编辑:所以我做了Greg推荐的,这就是我所拥有的.我想知道NA输出,但不确定它为什么存在.
> data$Trim<-factor(data$Trim)
> data$Model<-factor(data$Model)
> data$Type<-factor(data$Type)
> data=cbind(Price,Mileage,Buick,Cadillac,Chevrolet,Pontiac,SAAB,Saturn,Model,Trim,Type,Cylinder,Liter,Doors,Cruise,Sound,Leather)
> fit <- lm( Price ~ Mileage+Buick+Cadillac+Chevrolet+Pontiac+SAAB+Saturn+Model+Trim+Type+Cylinder+Liter+Doors+Cruise+Sound+Leather, x=TRUE )
> summary(fit)
Run Code Online (Sandbox Code Playgroud)
然后我得到一条消息"系数:(21由于奇点而未定义)",对于某些变量,输出为NA.
所以我在页面生效并且信息试图发布后收到错误.
SqlConnection conn = new SqlConnection("AddusConString");
SqlCommand cmd = new SqlCommand(sql);
int checkValue = 0;
checkValue++; //increment ID used to build parameter name
string parmName = String.Format("@Value{0}", checkValue);
SqlParameter newParameter = new SqlParameter();
newParameter.ParameterName = parmName;
// Handle TextBox value
cmd.Parameters.Add("@FName", FName.Text);
cmd.Parameters.Add("@LName", LName.Text);
Run Code Online (Sandbox Code Playgroud)
它突出了
SqlConnection conn = new SqlConnection("AddusConString");
Run Code Online (Sandbox Code Playgroud)
说"初始化字符串的格式不符合从index0开始的规范"
这是我的web.config页面的代码
<configuration>
<connectionStrings>
<add name="AddusConString" connectionString="Data Source=localhost;Initial Catalog=AddusWebsite;Integrated Security=True" providerName="System.Data.SqlClient"/>
</connectionStrings>
<system.web>
<compilation debug="true">
<assemblies>
<add assembly="System.Data.Linq, Version=4.0.0.0, Culture=neutral, PublicKeyToken=B77A5C561934E089"/>
<add assembly="System.Core, Version=4.0.0.0, Culture=neutral, PublicKeyToken=B77A5C561934E089"/></assemblies></compilation>
</system.web>
Run Code Online (Sandbox Code Playgroud)
我在R中创建的模型是:
fit <- lm(hired ~ educ + exper + sex, data=data)
Run Code Online (Sandbox Code Playgroud)
我不确定的是如何适应模型来预测感兴趣的概率,其中p = pr(雇用= 1).
任何帮助将不胜感激,谢谢
编辑:glm在我的模型中扮演什么角色呢?(我的答案如下)基于Jason对Greg的回答所做的编辑我不明白它具体做了什么.
我的答案是否分析了被录用的几率?