CIP 2022 FAQs T1

整理： 王凯璇 (南开大学)
邮箱： wangkaixuannk@163.com

${\color{red}{温馨提示：,10\ 月\ 30\ 日前都接受报名}}$

10 月 15-16 日，斯坦福大学徐轶青老师讲解了「面板数据因果推断」专题的第 1-2 讲。课后的答疑环节讨论非常热烈，先整理出来供大家学习。

本次课程分为 6 讲，每讲三个小时。10 月 30 日前都接受报名。

10 月 15 日课程 (3 小时)：

介绍本课程的准备知识
复习回顾经典双重固定效应模型，包括：
- 模型假设
- 点估计
- 不确定性估计
- 假设检验

10 月 16 日课程 (3 小时)：

介绍经典倍差法 (DID) 的历史、和它被引入经济学的过程
介绍 DID 设计的识别：潜在结果框架；
SUTVA 和无预期效应；
选择性偏误与平行趋势假设以及对 DID 法的威胁。
介绍 DID 设计的估计：
- 点估计和标准误；
- DID 与协变量以及大样本性质和统计推断

每天开课后，大家可以随时提交自己的问题，由助教收集整理后进行初步分类和解答。对于一些无法直接给出解答的问题，则汇总后发送给徐轶青老师，在课后统一作答。

参加此次课程的学员超过 300 人，他们来自各个领域。这意味着答疑中涉及的问题能够大体上反映目前大家在做面板因果推断过程种遇到的各种问题和疑惑。

现由助教团队梳理出来，以帮助各位更好地掌握面板因果推断的相关方法。

课程概况

时间： 2022 年 10 月 15-16 (已上线)；22-23；29-30 日
- 讲授： 9:00-12:00，答疑： 12:00-12:30
- Note：如此安排，让大家有充裕的时间复习、演练和阅读相关论文。
方式： 网络直播 + 回放
授课方式： 幻灯片+Stata16/17 实操演示，全程电子板书+Stata 演示截图，课后以 PDF 形式分享给学员。
授课嘉宾： 徐轶青 (斯坦福大学)
全程答疑： 20 位经验丰富的助教，答疑文档公布于课程主页。
课程主页： https://www.lianxh.cn/news/b335ff50a929f.html
报名链接： http://junquan18903405450.mikecrm.com/lgGhkTZ
PDF 课纲： https://file.lianxh.cn/KC/lianxh_CIP.pdf

${\color{red}{温馨提示：,10\ 月\ 30\ 日前都接受报名}}$

扫码查看课程详情：

1. 研究设计

Q1：能否请徐老师大致介绍一下 Sequential Ignorability Assumption

答：这个问题第三讲会详细讲的，请大家不要着急。
基本上其实我刚才已经讲过了，意思就是明天的 treatment assignment 是和今天的 $Y$ 的取值是有关的。
例如我昨天生病了，然后医生今天给我开了新的药，这就是 sequential assignment。Sequential Ignorability 是说给定我可以观察到所有信息，包括你过去的身体状况，过去的 Y，我是不是给药，改变我的 treatment 是随机的，这叫 Sequential Ignorability。
但是在 Sequential Ignorability 情况下是不能有 fixed effect 的，也不能有不随时间变化的混淆变量的，这就是一个权衡。所以，要么是 sequential，没有 fixed effect，要么是有 fixed effect，不能有 sequential。

(回答人：徐轶青，整理人：郭盼亭）

Q2：fixed effects 中的 within estimator 和 between estimator 是各利用组内变异与组间变异，那么 two way fixed effects 利用的是什么变异？

答：在没有交错处理情况或者加权问题存在的时候, two way fixed effects (TWFE) 可以理解成 DID 的效果，换句话说 two way fixed effects 估计是 DID 的一种实现方式。
(回答人：徐轶青，整理人：陈云菲)

Q3：请问可否请老师再讲解一下第二篇文章的设计和传统 did 的区别呢？

在徐老师（2022）的文章中，所有人都受到了饥荒的冲击，不存在不受饥荒冲击的地区，只是由于宗族的存在导致不同地区所收到的饥荒的冲击大小不同，因此宗族相当于是一个调节变量（moderator）。在传统 did 中，一般要求存在不受冲击影响的对照组，由此可见徐老师（2022）的文章并非传统的 did。
(回答人：张铭鑫）

Q4：第一篇文章 $K$ 的基点怎么选择的？

答：在包含常数项的动态效应模型中，往往需要删除其中一期作为基准期以避免共线性问题，一般选择处理前一期或者距离处理期最远的处理前样本期。徐老师的文章中是把处理前大于 5 期（$k<-5$）bin 到一起作为基期，具体的处理可以参考徐老师的代码和数据。
(回答人：王本丞）

Q5 问：如果一个政策在 2018 年部分上市公司实施，2019 年就在所有的上市公司全部实施了，可以用多期 did 吗？如果一个政策一开始就是适用于全部上市公司，没有对照组，是不是不能用 did 的方法识别政策效应呢？

答：
问题 1：所有个体最终都进入了实验组接受了干预，这种情况是可以做多期 DID 的；
问题 2：如果政策只影响全体，同时找不到其他不受处理的个体作为控制组，同时拥有政策出台前后多期数据。
那么建议这样思考: 政策虽然影响全体，但影响的强度不一样，依据影响强度不同构建相应指标，采用(连续变量)双重差分方法估计。可参考文献：
Nunn.N and Qian.N,2011,“The Impact of Potatoes on Old World Population and Urbanization”, The Quarterly Journal of Econom ics, 126(2)，563-650.
(回答人：陈云菲）

Q6 问：徐老师，请问差分里面控制变量的作用是为了排除自选择吗？和普通回归方法的控制变量有区别吗

答：DID 与普通回归中控制变量用来在回归分析中缓解混杂变量对因果效应估计的干扰，DID 中更加关注 $D$ 的处理效应，对控制变量的解释不作为重点。具体关于控制变量的影响、作用和选择，可以参考连享会推文：

控制变量！控制变量！

不用太关心控制变量，真的！

控制变量越多越好吗？

Stata：控制变量与核心解释变量地位对等吗？

控制变量如何选？大牛们的10条建议

(回答人：陈云菲）

Q7 问：关于为什么 “广义倍差法不是倍差法” 的解释不是很清楚

答：徐老师认为传统的 DID 可以从两个角度理解，一个是 design 的视角，需要满足平行趋势假定；另一个是 estimator 的视角，即通过回归方程估计参数。
“广义”倍差法更多的是一种 estimator 的估计方法，而不是一种严格意义上的 design。
(回答人：王本丞）

Q8 问：请问老师可以再讲一遍 partial out time 的操作吗

答：当 $D$ 是连续变量时，分别估计两个方程：
首先，使用 $Y$ 对一系列时间虚拟变量进行回归，然后取残差用以时间变量对 $Y$ 的解释力，即从 $Y$ 中剔除时间的影响；
其次，使用 $D$ 对一系列时间虚拟变量进行回归，然后取残差用以消除时间变量对 $D$ 的解释力。
在完成上述两步之后，以 $D$ 的残差做横轴，以 $Y$ 的残差做纵轴，即得到消除时间变量影响之后的两者之间的关系。（张铭鑫）

Q9 问：以 DID 为例，政策会对我的 output 产生影响，在这种情况下如何理解 $Y_i$ 独立于 $D_i$ 这样的处理变量条件强外生假设？

答：在这利用 Rubin 的潜在因果框架更有助于理解，徐老师这里强调并不是可观测的 $Y_i$ 条件独立于 $D_i$，而是潜在结果条件独立于处理变量 $D_i$。
换句话说，个体是否接受处理的潜在结果本身是独立于实际可观测的处理状态的。现在的研究中我们一般可以使用 Rubin 潜在因果框架定义和识别处理效应。
(回答人：王本丞）

Q10. 老师您讲的从研究设计上来讲，倍差法这类最好，但是这种的研究不是只适用于政策研究吗？

A: 从内部效度来说，实验法肯定要比倍差法好，RDD 是其次的，面板要次于 RDD。
(回答人：徐老师；整理人：王胜文）

Q11. 老师好，请解释一下传统模型是基于结果，但因果推断是基于设计的吗？

A: 传统模型只有在模型设定正确的情况下才能准确估计，传统模型和因果推断不矛盾，但前者很难满足。因果推断以 $D$（处理变量）的生成机制为出发点来选择研究设计，仅仅识别可识别的因果效应（仅识别能使用 DID 或 RD 或 IV 等的情况）。
(回答人：徐轶青，整理人：冯超楠）

Q12. 老师好，请问数据时间没有包含政策时间，比如政策是 2013 年实施，但是只有 2014 与 2018 年数据，能做 DID 吗？

A: 不能。因为做 DID 需要政策实施前后的数据，政策于 2013 年实施，需要准备 2013 年前后的数据。2014 与 2018 都是政策实施后，缺乏政策实施前的数据，所以不能。（解答：徐老师；整理人：王舒瑶）

Q13. 国内做 DID 的时候很常用某一变量的中位数作为分组变量的依据。例如，劳动合同法的处理组就是高劳动密集的企业，这样的做法是否合理？如果要这样做，是不是应该用冲击前一年的劳动密集情况做分组依据？

A: 用中位数数分组，和用各种分位数分组都是可以的，相当于按照面对冲击的暴露强度，分成两组或者若干组。这相当于 Duflo (2001) 的强度差分的简化版。使用前一年的更外生一些。
(回答人：王凯璇；整理人：屠西伟）

Q14. 有论文的模型设定是连续变量乘以政策虚拟变量，这样设定有什么好处吗？核心解释变量为“就业人数 × 刺激就业政策”的实施时间虚拟变量。一般这么设定还需要分别加入就业人数与刺激就业政策的实施时间虚拟变量吗？

A: 一般而言，像这种全国一刀切的政策，没有办法像之前那样严格区分处理组和控制组，只能以连续变量区分处理强弱，然后再与政策前后的时间虚拟变量交乘。
使用 “连续变量$\times$政策虚拟变量” ，可以更好地捕捉连续变量增加的动态效应。一般这样设定需要分别加入就业人数与刺激就业政策的实施时间虚拟变量，但是会被固定效应所吸收。
（回答：王凯璇；屠西伟；整理人：王胜文）

2. 内生性

Q1 如果 $Y$ 是 quarterly county income, control variable 可以用 annual gdp 吗

答：如果是县的收入和国家的 GDP, 可能存在同时性 (simultaneity) 的问题，因为县的收入也是国家的 GDP 的一部分。虽然中国有 3000 多个县，一个县的收入的影响程度相对较小，让同时性的问题没有那么严重，但还是有点奇怪。因此，建议将变量换成县收入增长率和国家 GDP 的增长率，或增加控制地级市/省的趋势。
(回答人：徐轶青，整理人：陈云菲)

Q2.同时性问题就等于内生性吗？

A: 是的，同时性是内生性的一种。
(回答人：徐老师；整理人：王胜文）

Q3.为什么说遗漏变量、互为因果、同时性本质都是 selection 的问题？

A: 三者都是在因果推断的框架里面，都是对强 Selection on observable 假设的违反，就是进行了 selection ，但是没去识别关键的变量。再解释一下什么是识别，识别和有多少数据没有关系的，因为没有关键信息，比如说教育对收入的影响，当我们无法控制能力等遗漏变量，再多的数据，我们无法识别教育和收入的因果效应。
(回答人：徐老师；整理人：王胜文，屠西伟）

Q4. 对于老师提到的反向因果问题，之前很多文章都会将解释变量滞后一期，说用以解决反向因果问题，但现在都说这种方法并不可行，请问是为什么呢？

A: 需要因果图解释，后续会详细讲解。这种解释变量滞后一期这种方法“最多”只能“减轻”反向因果关系的问题，没办法彻底解决。参见连享会：https://www.lianxh.cn/news/c45f6113e2c2a.html> 和 https://www.lianxh.cn/news/ca876910609c8.html
(回答人：徐轶青，刘佳宁，郭盼亭；整理人：王凯璇）

Q5. 请问若 DID 中的 shock 存在反向因果的问题，那需要为该 shock 找一个 IV 吗？

A: DID 识别策略中并不要求政策冲击外生，只要平行趋势假设成立，反向因果问题不会产生问题。工具变量不是必需的，当然也可以做个稳健性检验。（回答：屠西伟）
稳健性检验可以看一下这篇文章的应用：《长期护理保险、医疗费用控制与价值医疗》，通过挑选控制组的方法进行检验（回答：陈云菲，整理人：屠西伟）

3. 固定效应

Q1：老师和助教好！我想问一下多期 DID 中使用企业层面的面板，但政策冲击是地区层面的，那么只控制地区 fe 和 year fe 允许吗？应该与个体＋时间的估计结果差异较大，但平常两种方法都能看到。简而言之，固定效应的控制基本上应该控制与这个政策冲击的同一层面就够了，控制到更细的层面是更严格，但不是必要的。

答：如果政策冲击是地区层面的，只控制到地区、时间层面的固定效应是可以的，更好的选择是把数据压缩到地区层面，然后在地区层面跑回归，这是比较简单的方式。
但如果你觉得想跑一个特别大的样本，需要注意 cluster 在地区层面，这个会有细微的差别，因为如果你是 cluster 的话，相当于以每个地区的企业数目进行加权，但如果你现在平均到这个地区层面，每个地区它的权重是一样的。
两个差异的原因是权重不一样，例如假设上海有 1 万个企业，然后甘肃有 1000 个企业，然后两个都是省，都是地区层面的，然后假如你在企业层面跑回归，上海的权重就是甘肃的十倍。然后，如果先压缩到上海和甘肃，那上海和甘肃就是 1 : 1，这是出现差异的原因。哪一个更正确，取决于研究背景。
(回答人：徐轶青，整理人：郭盼亭）

Q2：TWFE 适用于昨天讲的哪种面板数据？能先简要总结一下这门课的几个方法哪些适用与大 $N$ 小 $T$、大 $T$ 小 $N$、大 $T$ 大 $N$ 吗？老师说的大 $N$ 大 $T$ 型的面板，一般 $N$ 和 $T$ 需要大于几期？

答：理论上大 $N$ 小 $T$ 适用，大 $T$ 小 $N$ 是不可以用的，但实践中大家都在用，大 $N$ 大 $T$ 用 TWFE 需要满足强外生假设。如果是浅因子模型的话，大 $N$ 大 $T$ 需要 N、T 特别大，在应用中至少超过 30，最好是 40、50 以上。因为大数定律起作用的话，至少需要 30、40 以上才能够收敛，还要考虑 estimate 的收敛速度的问题。

(回答人：徐轶青，整理人：郑晓雪）

Q3：请问控制单位趋势和控制 time FE 相比，更加控制了哪类 counfounders 呢？

答：控制时间 time FE 的用意在于吸收时间维度上不可观测的同质性冲击的影响，即所有个体共有的时间因素，如宏观经济冲击、财政货币政策等等，假定这些因素在特定年份对不同个体的影响是一致的。控制单位趋势是为了控制不同个体的被解释变量可能存在的并且尚未被其他控制变量和 FE 所覆盖/解释的增减趋势，因为不同组别（规模、性质、政策分组、生命周期等）个体的被解释变量的时间趋势或许存在一定程度的差异，并且在控制已有的解释变量之后依然可能存在较为明显的时间趋势。
(回答人：徐轶青，整理人：冀承）

Q4：为什么第二篇文章的模型里只有交叉项，没有放主效应？

答：因为第二篇文章的模型中分别加入了城市（country）和年份（year）层面的固定效应，因此主效应（$Clan$ 与 $Famine$）的效应被固定效应吸收，所以回归方程中无需再加入主效应，该做法在国内主流期刊中也被普遍接受。
(回答人：张铭鑫）

Q5 问：老师好，在双重固定模型设定那张 PPT，D 是连续变量时，t 是不变化的影响？老师是如何把时间这个变量处理掉，不表示在坐标里？上课期间，听得不是很懂

答：当 $D$ 是连续变量时，分别估计两个方程：首先使用 $Y$ 对一系列时间虚拟变量进行回归，然后取残差用以时间变量对 $Y$ 的解释力，即从 $Y$ 中剔除时间的影响；其次，使用 $D$ 对一系列时间虚拟变量进行回归，然后取残差用以消除时间变量对 $D$ 的解释力。在完成上述两步之后，以 $D$ 的残差做横轴，以 $Y$ 的残差做纵轴，即得到消除时间变量影响之后的两者之间的关系。
(回答人：张铭鑫）

Q6 问：课程上说双重固定效应的 OLS 回归是一致估计，但 $D$ 和 $X$ 存在多重共线性，这不是会导致评估有偏吗？

答：D(it)和 $X$ 一般不会存在多重共线的问题，在强外生性等条件满足情况下，双向固定效应的估计才是一致估计。
(回答人：屠西伟）

Q7 问：2x2DID 中的两个 differences 分别来自于时间和空间。请问为什么 2WFE 模型也可以看做是 DID？如果解释变量是一个虚拟变量，2WFE 中的因果效应不就只有一个 difference 吗?

答：2WFE 就是 two-way fixed effects，双向固定效应，包含时间和空间两个维度，分组虚拟变量（处理组=1，控制组=0）；时间虚拟变量（政策实施后=1，政策实施前=0）；交互项表示处理组在政策实施后的效应。
(回答人：陈云菲）

Q8 问：请问在 event study 上，如果 shock 是对所有个体同时发生的，是不是无法加时间固定效应了，谢谢

答：如果 shock 本身是对所有个体同时发生，就是标准的 DID 形式，即 treat×post 形式。如果 shock 的强度在不同个体间具有差异，那么可以利用强度（intensity）DID 或连续 DID 的方式估计，可以加入时间固定效应进行控制。
(回答人：王本丞）

Q9 问：请问双向固定效应模型是不是永远优于控制单独的 unit 或者 time 的 fixed effects models? 如果不是，在什么情况下应该选择普通的 fixed effects models?

答：在固定效应模型中，在选择双向固定效应模型或者个体（时间）固定效应时重点在于研究者对不可观测变量的假设：是否存在不随时间变化但随个体变化的的不可观测因素（例如地区的宗教、气候、地理条件）会导致内生性问题？同时是否存在不随地区变化但随时间变化的不可观测因素（经济周期、时间趋势）会导致内生性问题？如果上述两种因素都存在（这往往是一个更现实的假设），那么双向固定效应模型就是更合适的。如果研究者对于数据影响机制有非常清楚的认识以及证据能够证明只存在某一种不可观测变量而没有另一种，那么单个固定效应在一定程度上也可以接受。关于固定效应模型的更多话题可见如下推文： FE！FE！面板固定效应模型：你用对了吗

(回答人：张铭鑫）

双向固定效应模型一般而言是优于控制单个固定效应，因为无论是时间固定效应、还是个体固定效应都不可避免与核心解释变量相关，除非能够给出强有力不控制的证据。固定效应的控制是因果识别方法中消除混杂因素的手段，是在尽力满足核心变量外生性的手段，不是一种机械性操作(回答：屠西伟）。

Q10 问：fixed effects 中的 within estimator 和 between estimator 是各利用组内变异与组间变异，那么 twoway fixed effects 利用的是什么变异

答：双向固定效应，你可以理解为两步去除固定效应的估计，第一步是组内估计，去除个体固定效应，第二步利用第一步 demean 掉的各变量去除组间的时间固定效应。
(回答人：屠西伟）

Q11 问：post*treat+post+treat，后面两项 post 和 treat 可以在回归中省略吗？

答：当使用双向固定效应模型时，post 项与 treat 项可被个体固定效应和时间固定效应吸收，因此可以省略，但是若模型中没有加入双向固定效应则 post 项与 treat 项不可省略。

(回答人：张铭鑫）

Q12 问：双向固定效应模型具体和 DID 是什么关系？是不是可以认为老师今天所讲的第一篇论文例子应用的是多期 DID 的方法？

答：传统的 DID 研究设计可以直接利用 OLS 进行估计，在面板数据的情况下我们一般使用 TWFE（双向固定效应）模型，通过控制双向固定效应可以吸收一次项，只需要保留交叉项即可。可以参考文献：黄炜，张子尧，刘安然．从双重差分法到事件研究法[J/OL]．产业经济评论. https://doi.org/10.19313/j.cnki.cn10-1223/f.20211227.002。
(回答人：王本丞）

Q13 问：i.year#i.province 和 c.year#i.province 操作上很常见，但经济含义上的区别是什么，控制的是哪个层面上的 controls，能举个例子吗

答：i.year#i.province 去除了在省份层面所有控制变量，包括省份层面随时间变量和不随时间变化的不可观测变量。c.year#i.province 只是控制了各个省份的时间趋势，相当于每个省份有个时间趋势，每个省份的时间趋势都不一样。控制 i.year#i.province 比控制 c.year#i.province 更加严格（回答：屠西伟）

Q14 问：为什么双向固定效应模型可以被理解为事件研究法？

答：双向固定效应模型是一种估计方法，DID、交错 DID 或者事件研究法都是一种研究设计。在满足识别假设的条件下，我们可以使用双向固定效应模型识别我们想要的因果效应参数。双向固定效应既可以用于 DID 研究，也可以用于事件研究法。可以参考文献：黄炜，张子尧，刘安然．从双重差分法到事件研究法[J/OL]．产业经济评论. https://doi.org/10.19313/j.cnki.cn10-1223/f.20211227.002。
(回答人：王本丞）

Q15 问：我的问题是由于一些文献指出 within unit 或者 within year 的比较，所以多维固定效应是否不能完全排除 unit-level heterogeneity and time shocks，但是可以在很大程度上排除或者控制这些因素（比如在双向固定效应下，因为 twfe 相当于 two way mundlak estimator）？

答：问题 1：多维固定效应最终其实是个体去均值后的结果，在加入个体固定效应后，我们将回归限制在“对 $X$ 组内变异的分析”，这个过程不仅消除了随个体变化不随时间变化的不可观测变量，也消除了随个体变化不随时间变化部分可观测变量，因此不能完全得到 between unit 的比较。问题 2：多维固定效应可以排除一定不可观测因素，但无法完全排除。例如在加入个体、时间固定效应后，我们只排除了随个体变化不随时间变化的效应以及随时间变化不随个体变化的效应；但对于随时间、个体变化的效应是不可以排除的。

(回答人：刘佳宁）

我感觉你的理解是对的。TWFE 还是一种很好的方法，可以很大程度上控制住 confounders. 如果在模型设定的时候，允许异质性随个体和随时间都改变的话(fully saturated model)，可能会因为 parameters > observations 而导致你的回归方程估不出来。所以你说“无法完全排除个体和时间层面的处理效应异质性” 也是对的。Wooldridge, J. (2021). Two-way fixed effects, the two-way mundlak regression, and difference-in-differences estimators. Available at SSRN 3906345. 可以参考一下 wooldridge 这篇文章，感觉大佬还是很力挺 TWFE 的，尽管现在出了一大波新文献来说 TWFE 估计得 beta 是有偏误的。
(回答人：郭楚玉）

Q16 问：第一篇文章加入省级变量和时间变量交乘项的目的是什么？

答：控制包括省份层面随时间变量和不随时间变化的不可观测变量。
(回答人：陈云菲）

4. 动态效应与平行趋势

Q1：请问为什么在画动态系数图时，选取的模型是不带 control 的？

答：带 control 和不带 control 都是可以的，带 control 可能会损失一部分样本。
(回答人：徐轶青，整理人：陈云菲)

Q2：平行趋势假设可否再讲一次，刚刚右上角被您的头像遮住了

答：平行趋势假设在多期情况下，可以 x 假设 $D$ = 0（基准没有干预时）,控制协变量 X,没有干预情况下的潜结果在两个时间的差对于所有的 i 都是一样的。
(回答人：徐轶青，整理人：冀承）

Q3：请问第一个论文例子中动态效应的 baseline 是什么？

答：参考徐老师（2015）文章中对文中图 3 的描述（即动态效应图），该文在讨论动态效应时将来自第一或第二大家族的村官上任五年之前的数据合并起来作为动态效应的基准组（reference category）。
(回答人：张铭鑫）

Q4 问：动态效应检验，可以不用全画么？全画出来不满足检验，但如果只画前后两的，就能通过检验。或者如果遇到政策实行前后都不显著，可不可以只画政策实行前的不显著图，然后说政策实行前没有显著差异。

答：这个是不行的，需要给出完整时间，处理前后的时间都要给出。如果平行趋势假设不满足，这个时候需要去思考不满足的原因。（回答：屠西伟）

平行趋势检验的目的在于验证 DID 模型能够赋予回归系数因果含义的关键假设，因此在动态效应图中作者应当对所示用样本区间内各期动态效应予以展示来佐证文章结果的可信性与可靠性，展示挑选过后的结果或者仅展示部分结果都会使文章结果的信度造成一定程度的损失。更多关于动态效应检验请关注

Stata：一行代码绘制平行趋势图-eventdd

Stata：平行趋势不满足？主成分 DID 来帮你！- pcdid

多期 DID 之安慰剂检验、平行趋势检验

Stata 倍分法: 不满足平行趋势假设咋办？

多期 DID：平行趋势检验图示

(回答人：张铭鑫）

Q5 问：动态处理效应第一项希望可以有个简单的数据的例子

答：可以参考连享会平行趋势检验的相关推文，

一行代码绘制平行趋势图-eventdd
(回答人：陈希）

Q6 问：动态效应图是不是替代平行趋势图，两个图有何差异？

答：我们传统的 DID，简单理解为两组，处理时点是固定的，这个时候可以画出事前的平行趋势。在多时点的 DID 中，不同处理组，处理时点也不同，这时候难以画出之前的平行趋势图，这时候我们基于时间研究法，我们可以得到在处理发生前的各期的估计系数，例如处理前的第二期(-2),这个对应的估计系数就是在解释相对于基准组的差异，如果不显著，就说明不存在政策效应。平行趋势检验目的也是在说政策发生前没有处理效应的发生。
(回答人：屠西伟）

Q7 问：画动态图可以理解为平行趋势的检验吗，有了动态图就说明用 did 合理？

答：当前使用 DID 进行研究设计就必须要画动态图（event study），这样的好处在于：一方面可以检验事前处理组和控制组是否满足平行趋势；另一方面可以考察在接受处理后处理效应随时间变化的趋势，例如效应持续性等。有了动态图并不能充分说明 DID 的合理性，平行趋势检验通过不能说明 DID 设计完全有效，还需要满足 DID 设计中的其他假设，例如 SUTVA 等。可以参考：黄炜，张子尧，刘安然．从双重差分法到事件研究法[J/OL]．产业经济评论. https://doi.org/10.19313/j.cnki.cn10-1223/f.20211227.002。
(回答人：王本丞）

Q8 问：平行趋势检验与动态处理效应有什么不同，感觉图非常像

答：平行趋势检验和动态处理效应都可以通过事件研究法得到。动态处理效应图可以反映以下两点信息：一是处理前是否满足平行趋势假定，即系数是否显著；二是处理后处理效应的持续性。
(回答人：王本丞）

Q9 问：画平行趋势图，国外大多把 t=-1 作为基准组，但国内是把处理变量和每一期的交互项都放进去，这两者有什么差异，哪一个做法更科学？

平行趋势检验需要有一期作为“标杆”（基准组），然后将其他各期与这一“标杆”进行对比，从而判断处理组与控制组的差异是否随时间发生了显著变化，关于基准组的选择主要有两种：第 1 期（基期，最开始的一期）或者-1 期（政策时点前 1 期）。如果选择基期作为基准组，那就是以政策第 1 期为“标杆”，我们需要丢掉第 1 期，如果选择-1 期作为基准组，那就是以政策前第 1 期为“标杆”，需要丢掉 pre1，这样可能就会显得有些突兀，突然从-2 期就跳到第 0 期了，所以很多人都会在绘图时都会加上-1 期的估计系数和置信区间。所以两种方法都是可以验证平行趋势的，可以自行选择
(回答人：陈云菲）

Q10 问：通常要满足 $D$ 与 $Y$ 是满足平行趋势的，也允许 x 与 d 相关；但如果想排出个体会对 $D$ 的实施有策略调整，即 $X$ 调整，想看看 $D$ 是否对 $X$ 产生影响，这时候要满足平行吗？即便 $D$ 对 $Y$ 的影响控制了 X。比如在政策正式实施前就有政策的 announce, reviewer 想看 observed effect 不受个体对 x 调整的影响

答：首先 $X$ 的控制变量是事前变量，意思是 $X$ 对 $D$ 可以产生影响，但 $D$ 对 $X$ 产生影响是不行的，会产生 Bad control 的问题。

Q11 问：为什么动态设定能够检验强外生性假设？

答：动态效应可以检验事前处理组和控制组是否满足平行趋势，如果估计系数不显著表明两组并不存在趋势上的显著差异，事前的平行趋势假设得到满足。需要说明的是，强外生性假设是定义在不可观测的潜在因果框架下的，并不能借助可观测数据进行完全检验。平行趋势检验只是强外生假设的一个推论，并且真实的平行趋势同样无法检验，只能借助事前的平行趋势提供部分证据。
(回答人：王本丞）

Q12 问：今天讲的双向固定效应模型设定中为什么没有常数项？

答：常数项本质上是一个既不随时间也不随个体变化的变量，在加入个体和时间固定效应后可以常数项可以被固定效应吸收。

(回答人：张铭鑫）

Q13 问：面板数据中如果某个个体，在前后两段时间里处理变量为 1，例如 $D$ 随时间的变化是 111000111000 或者是 001110001111100 这种，那么在动态处理效应中应该如何编码？

答：按照你的例子，这是一种存在进入退出情形的 DID 设计，即同一个体在接受处理后还可以从状态 1 退化为状态 0 的情形。
Goodman Bacon（2021）在附录部分讨论了这一情形可能存在的偏误问题。另外还可以参考以下几篇文章：

Andrew Goodman-Bacon, 2021. Difference-in-differences with variation in treatment timing. JoE 225, 254–277. https://doi.org/10.1016/j.jeconom.2021.03.014

徐轶青老师在 imputation 的视角下提供了处理方法：Licheng Liu, Ye Wang, Yiqing Xu, 2022. A Practical Guide to Counterfactual Estimators for Causal Inference with Time-Series Cross-Sectional Data. American Journal of Political Science. https://doi.org/10.1111/ajps.12723
此外最近许文立老师发表在《财政研究》的文章中讨论了这一情形：

田淑英, 孙磊, 许文立, 范子英. 绿色低碳发展目标下财政政策促进企业转型升级研究——来自“节能减排财政政策综合示范城市”试点的证据[J]. 财政研究, 2022 (8): 79-96. DOI:10.19477/j.cnki.11-1077/f.2022.08.008.
(回答人：王本丞）

Q14. 请问老师，三重差分需要做平行趋势检验吗，如何做？

A: 一般不需要。平行趋势是对因果关系是否成立进行的检验，而三重差分是对已成立的因果关系做的异质性检验。如果文章主体为 DDD，而不是将 DDD 作为 DID 异质性的小拓展。则需要进行平行趋势检验，具体做法可通过绘图或者事件研究法，参照文献:

齐绍洲,林屾 & 崔静波.(2018).环境权益交易市场能否诱发绿色创新?——基于我国上市公司绿色专利数据的证据. 经济研究(12),129-143.

Cai, X., Lu, Y., Wu, M., & Yu, L. (2016). Does environmental regulation drive away inbound foreign direct investment? Evidence from a quasi-natural experiment in China. Journal of Development Economics, 123, 73-85, -Link-

Shi, X., & Xu, Z. (2018). Environmental regulation and firm exports: Evidence from the eleventh Five-Year Plan in China. Journal of Environmental Economics and Management, 89, 187-200. -Link-
（回答：王舒瑶，刘佳宁；整理人：屠西伟）

5. 相关推文

Note：产生如下推文列表的 Stata 命令为： lianxh DID, m 安装最新版 lianxh 命令： ssc install lianxh, replace

lianxh.ch | 知乎

CIP 专题：FAQs

已发布: 2022.10.18

待更新 ... ...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly