如何在 R 的“ivprobit”包中使用“ivprobit”函数?

Eri*_*ric 5 syntax regression r logistic-regression

我试图了解 R 中“ivprobit”包中“ivprobit”函数的语法。指令说:

 Usage
 ivprobit(formula, data)

 Arguments
    formula y~x|y1|x2 whre y is the dichotomous l.h.s.,x is the r.h.s.    
            exogenous variables,y1 is the r.h.s. endogenous variables and 
            x2 is the complete set of instruments
    data    the dataframe
Run Code Online (Sandbox Code Playgroud)

然后它显示了相应的例子:

 data(eco)

 pro<-ivprobit(d2~ltass+roe+div|eqrat+bonus|ltass+roe+div+gap+cfa,eco)

 summary(pro)
Run Code Online (Sandbox Code Playgroud)

如果我符合指令的解释,

 y= d2 = dichotomous l.h.s.
 x= ltass+roe+div = the r.h.s. exogenous variables
 y1= eqrat+bonus = the r.h.s. endogenous variables
 x2= tass+roe+div+gap+cfa = the complete set of instruments
Run Code Online (Sandbox Code Playgroud)

我不明白 x 和 x2 之间的区别。另外,如果 x2 是完整的工具集,为什么它不包括内生变量 y1 呢?相反,它另外包括“gap”和“cfa”变量,它们甚至没有显示在 x(外生变量)甚至 y 中。

假设,我选择的工具变量确实是“eqrat”和“bonus”,我如何构建知道x(外生变量)和x2(完整的工具集)之间的差异?

RLa*_*ave 6

请注意,这里我们讨论的是 sintax,而不是模型的“优点”,对于此类问题,您应该参考https://stats.stackexchange.com/

让我们用这个方程作为例子:在此输入图像描述

正如正确指出的那样,项目清单并不真正在等式中,这只是一个例子。

这里:

  • 在此输入图像描述是因变量;

  • 在此输入图像描述是“有问题”的内生变量(一个或多个);

  • 在此输入图像描述是不“有问题”的外生变量(一个或多个);
  • 项目清单是“帮助”内生变量的工具(一个或多个);

为什么内源性会出现问题?因为它们与错误相关在此输入图像描述,这会导致经典 OLS 估计出现问题。

在此输入图像描述是这些工具,因为它们具有一些基本特性(更多信息请参见此处):

  • 与误差项无关;
  • 不影响在此输入图像描述给定在此输入图像描述保持不变;
  • 与....有关在此输入图像描述

在提议的语法中,我们有:

  • x,外源性,对应于在此输入图像描述(没有问题);
  • y1,内源性,对应于在此输入图像描述(有问题);
  • x2,全套仪器,对应在此输入图像描述

在您引用的示例中,x2与 共享一些公共变量x,这是一组外生变量(没有问题),再加上两个工具。

该模型使用 3 个外生变量作为工具,再加上另外两个变量。

我不明白x和x2之间的区别

x2是工具,可能与外生变量集重叠也可能不重叠 ( x)。

如果 x2 是完整的工具集,为什么它不包括内生变量 y1?

不能包括内生变量,因为这些是方程需要使用仪器来处理的变量。


一个例子:

您想要建立一个模型来预测双亲家庭中的女性是否有工作。你有这些变量:

  • fem_works,响应或因变量;
  • fem_edu,女性的教育水平,外生;
  • kids,夫妇的孩子数量,外生;
  • other_income,家庭收入,内生的(您知道这是先验知识);
  • male_edu,男人的教育水平,仪器(你选择这个)。

对于ivprobit,这将是:

mod <- ivprobit(fem_works ~ fem_edu + kids | other_income | fem_edu + kids + male_edu, data)
Run Code Online (Sandbox Code Playgroud)

other_income对于模型来说是有问题的,因为您怀疑它与误差项相关(其他冲击可能会影响 和fem_worksother_income,您决定将其用作male_edu工具,以“缓解”该问题。(示例取自此处