Eri*_*ric 5 syntax regression r logistic-regression
我试图了解 R 中“ivprobit”包中“ivprobit”函数的语法。指令说:
Usage
ivprobit(formula, data)
Arguments
formula y~x|y1|x2 whre y is the dichotomous l.h.s.,x is the r.h.s.
exogenous variables,y1 is the r.h.s. endogenous variables and
x2 is the complete set of instruments
data the dataframe
Run Code Online (Sandbox Code Playgroud)
然后它显示了相应的例子:
data(eco)
pro<-ivprobit(d2~ltass+roe+div|eqrat+bonus|ltass+roe+div+gap+cfa,eco)
summary(pro)
Run Code Online (Sandbox Code Playgroud)
如果我符合指令的解释,
y= d2 = dichotomous l.h.s.
x= ltass+roe+div = the r.h.s. exogenous variables
y1= eqrat+bonus = the r.h.s. endogenous variables
x2= tass+roe+div+gap+cfa = the complete set of instruments
Run Code Online (Sandbox Code Playgroud)
我不明白 x 和 x2 之间的区别。另外,如果 x2 是完整的工具集,为什么它不包括内生变量 y1 呢?相反,它另外包括“gap”和“cfa”变量,它们甚至没有显示在 x(外生变量)甚至 y 中。
假设,我选择的工具变量确实是“eqrat”和“bonus”,我如何构建知道x(外生变量)和x2(完整的工具集)之间的差异?
请注意,这里我们讨论的是 sintax,而不是模型的“优点”,对于此类问题,您应该参考https://stats.stackexchange.com/。
这里:
为什么内源性会出现问题?因为它们与错误相关
,这会导致经典 OLS 估计出现问题。
是这些工具,因为它们具有一些基本特性(更多信息请参见此处):
在提议的语法中,我们有:
在您引用的示例中,x2与 共享一些公共变量x,这是一组外生变量(没有问题),再加上两个工具。
该模型使用 3 个外生变量作为工具,再加上另外两个变量。
我不明白x和x2之间的区别
x2是工具,可能与外生变量集重叠也可能不重叠 ( x)。
如果 x2 是完整的工具集,为什么它不包括内生变量 y1?
它不能包括内生变量,因为这些是方程需要使用仪器来处理的变量。
一个例子:
您想要建立一个模型来预测双亲家庭中的女性是否有工作。你有这些变量:
fem_works,响应或因变量;fem_edu,女性的教育水平,外生;kids,夫妇的孩子数量,外生;other_income,家庭收入,内生的(您知道这是先验知识);male_edu,男人的教育水平,仪器(你选择这个)。对于ivprobit,这将是:
mod <- ivprobit(fem_works ~ fem_edu + kids | other_income | fem_edu + kids + male_edu, data)
Run Code Online (Sandbox Code Playgroud)
other_income对于模型来说是有问题的,因为您怀疑它与误差项相关(其他冲击可能会影响 和fem_works)other_income,您决定将其用作male_edu工具,以“缓解”该问题。(示例取自此处)