页面载入中,请稍后...

潜在因果分析框架介绍|工具变量

作者: zzy5111398 分类: 数据科学,潜在因果分析框架 发布时间: 2018-10-24 16:08

本系列基于《Mostly Harmless Econometrics》一书,参考Rubin相关论著,给出微观计量理论基础的数理推导。

Rubin因果模型

这一部分,我们基于潜在结果框架给出一个估计IV和解释的框架。

首先,$Z_{i}=1$是指第$i$个人有一个较差的运气,应该被应召入伍当兵,同时$Z_{i}=0$表示第$i$个人运气不错,而不会被找去当兵。我们将Z定义为一个N维的向量,表示N个人每个人应召入伍的随机分配的情况,$D_{i}(Z)$则表示在这样的分配下,第$i$个人是否会去当兵。如果分配的方式很准确,那么将会使得$D_{i}(Z)$与$Z_{i}$对于每一个人相等,也就是运气不好的人全部被强制参军,而运气好的人没有一个主动去餐裙。实际上,由于一些原因,$D_{i}(Z)$与$Z_{i}$总是不想等的,那是由于一些人会自愿当兵,另一些人会拒绝入伍,或者一些人由于家庭原因或健康原因不能入伍。

与$D_{i}(Z)$的定义相似,我们还定义了$Y_{i}(D,Z)$,即在给定征兵分配下,一个人$i$是否去当兵(由$D$确定),导致的健康状况。$Y_{i}(D,Z)$也是一个N维向量,它和$D_{i}(Z)$共同表示的是“潜在的结果”。这里的潜在结果与Neyman(1923)随机农业试验中定义的“潜在收获”一致,并由Rubin(1974,1978,1990,1991)拓展到观测研究中。他通过一个一般的处理分配机制,运用贝叶斯和极大似然估计来估计潜在结果和分配机制的概率分布。原来的SEM模型中潜在结果时固定而不可观测的,仅能通过处理的分配来间接得知。儿潜在结果分析框架中的潜在结果是与随机分配结果(Z)有关。

 在一些研究中,个体间的交互作用是模型的一部分,而我们的模型中,由于处理变量和中间的潜在结果仅有两种水平,因此我们假定个体间不存在交互作用:

 假定一:个体处理值稳定假定(SUTVA)。

 

 a. 如果 $Z_{i}=Z_{i}’$,则$D_{i}(Z)=D_{i}(Z’)$

 b. 如果 $Z_{i}=Z_{i}’$,且$D_{i}=D_{i}’$,则$Y_{i}(Z,D)=Y_{i}(Z’,D’)$

 

 SUTVA暗示了每个个体的潜在结果与其他个体的处理无关。这一假定说明了个体的潜在结果可以表述为其自身处理的函数,也就是$Y_{i}(Z_{i},D_{i})$和$D_{i}(Z_{i})$。

 

假定二,随机分配

处理分配向量是随机的,也就是

$Pr(Z=c)=Pr(Z=c’)$

在SUTVA和随机分配假定下,我们得到了平均处理效应的无偏估计,即Y在Z分类下的加权平均之差和Y在D下的加权平均之差。这一结论最早由Neyman(1923)提出,其中Z对Y对因果效应,即Y在Z分类下的加权平均之差可以写作:

$\frac{\sum_{i}Y_{i}Z_{i}}{\sum_{i}Z_{i}}-\frac{\sum_{i}Y_{i}(1-Z_{i})}{\sum_{i}(1-Z_{i})}=\frac{\frac{1}{N}\sum_{i=1}^{N}Y_{i}Z_{i}-\frac{1}{N}\sum_{i=1}^{N}Y_{i}\frac{1}{N}\sum_{i=1}^{N}Z_{i}}{\frac{1}{N}\sum_{i=1}^{N}Z_{i}^{2}-(\frac{1}{N}\sum_{i=1}^{N}Z_{i})^{2}},(7)$

而对于Z对D对因果效应可以写作

$\frac{\sum_{i}D_{i}Z_{i}}{\sum_{i}Z_{i}}-\frac{\sum_{i}D_{i}(1-Z_{i})}{\sum_{i}(1-Z_{i})}=\frac{\frac{1}{N}\sum_{i=1}^{N}D_{i}Z_{i}-\frac{1}{N}\sum_{i=1}^{N}D_{i}\frac{1}{N}\sum_{i=1}^{N}Z_{i}}{\frac{1}{N}\sum_{i=1}^{N}Z_{i}^{2}-(\frac{1}{N}\sum_{i=1}^{N}Z_{i})^{2}},(8)$

两式的比即等于传统工具变量应用下的估计值(见式6),因此,工具变量下对平均处理效应为工具变量平均处理效应之比。


如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

发表评论

电子邮件地址不会被公开。