我正在使用R中的GLM对数据集进行统计分析。基本上,预测变量为:“探针”(实验中使用的探针类型-具有4个水平的因子),“提取”(实验中使用的提取类型-因子) (具有2个级别),“ Tank”(收集样品的容器编号-从1到9的整数)和“ Dilution”(每个样品的稀释度-数字:3.125、6.25、12.5、25、50、100 )。响应是从重复实验(“ Rep”)获得的阳性响应(“ Positive”)的数量。我想评估所有预测变量(及其相互作用)对阳性反应次数的影响,因此我尝试拟合这样的GLM模型:
y<-cbind(mydata$Positive,mydata$Rep - mydata$Positive)
model1<-glm(y~Probe*Extraction*Dilution*Tank, family=quasibinomial, data=mydata)
Run Code Online (Sandbox Code Playgroud)
但是后来我的主管通知我,“坦克”预测变量不应被视为基于级别的变量。也就是说,它的值是1到9,但这只是坦克标签,因此1与7之间的差值并不重要。将此变量视为因素只会使大型模型产生不良结果。那么,如何将“坦克”变量视为随机因素,并将其包含在GLM中呢?
谢谢
我有2个不同列长的数据帧.比如,df1
有3列(A,C,D)为10行,df2
有5列(A,B,C,D,E)为3行.如何将它们合并在一起并从df2(B和E)中删除不匹配的列,只留下df
13行和3列A,C,D?
谢谢