gpt4 book ai didi

regression - Stata clogit 命令与带有手动固定效果的 logit 不能(完全)重现 : Coefficients double

转载 作者:行者123 更新时间:2023-12-03 19:07:37 46 4
gpt4 key购买 nike

谢谢你回答我的问题!我正在 Stata 中实现条件逻辑回归。我有长格式的选择数据,其中每个选择都包含两个可用选项,决策者只能选择一个。我已经使用 Stata clogit 实现了它命令,在我的理解中,它为数据中的每个选择创建固定效应,并在将因变量回归到逻辑回归中剩余的解释变量之前将它们部分化。说服自己clogit做我认为的事情,我试图重现我使用 logit 得到的结果命令并手动添加固定效果。鉴于 Stata 对解释变量数量的限制,FWIW 对于大型数据集并不简单,但问题仍然存在于以下较小的 MWE:

* Retrieve MWE data set
webuse lowbirth2, clear

* Add arbitrary cluster variable, because in my real problem the data is clustered
gen cluster = ceil(_n/14)

clogit low lwt smoke ptd ht ui i.race, group(pairid) cluster(cluster)
Conditional (fixed-effects) logistic regression

Number of obs = 112
Wald chi2(7) = 211.55
Prob > chi2 = 0.0000
Log pseudolikelihood = -25.794271 Pseudo R2 = 0.3355

(Std. Err. adjusted for 8 clusters in cluster)
------------------------------------------------------------------------------
| Robust
low | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lwt | -.0183757 .0111176 -1.65 0.098 -.0401657 .0034144
smoke | 1.400656 .4670183 3.00 0.003 .4853172 2.315995
ptd | 1.808009 .6162347 2.93 0.003 .600211 3.015807
ht | 2.361152 .9149873 2.58 0.010 .5678096 4.154494
ui | 1.401929 .5968851 2.35 0.019 .2320559 2.571802
|
race |
black | .5713643 .5699717 1.00 0.316 -.5457596 1.688488
other | -.0253148 .5197248 -0.05 0.961 -1.043957 .9933272
------------------------------------------------------------------------------

logit low lwt smoke ptd ht ui i.race i.pairid, cluster(cluster)
Logistic regression Number of obs = 112
Wald chi2(6) = .
Prob > chi2 = .
Log pseudolikelihood = -51.588542 Pseudo R2 = 0.3355

(Std. Err. adjusted for 8 clusters in cluster)
------------------------------------------------------------------------------
| Robust
low | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
lwt | -.0367513 .0222351 -1.65 0.098 -.0803314 .0068288
smoke | 2.801312 .9340365 3.00 0.003 .9706343 4.63199
ptd | 3.616018 1.232469 2.93 0.003 1.200422 6.031613
ht | 4.722303 1.829975 2.58 0.010 1.135619 8.308988
ui | 2.803858 1.19377 2.35 0.019 .4641118 5.143605
|
race |
black | 1.142729 1.139943 1.00 0.316 -1.091519 3.376977
other | -.0506296 1.03945 -0.05 0.961 -2.087913 1.986654
|
pairid | ... omitted for brevity ...
查看这两个输出,我们可以看到系数、标准误和对数似然不仅不同,而且精确地翻倍 ,就好像因变量被缩放了 2 倍。我应该补充一点,当我不对标准误差进行聚类时,它们不再完全翻倍。所以, clogit似乎不只是部分消除对后端的固定影响,但它有什么作用? documentation也不是 clogit.ado文件本身已经为我解决了这个问题。

最佳答案

您观察到的估计值差异是由于估计值 logit 的附带参数问题造成的偏差。在有限面板中。
Greene (2004)讨论这种偏差,并注意偏差是 (1) 远离零,和 (2) 当 T=2 时高达 100%。
在您的情况下,T 不是时间,而是配对中的个体数量(即 2),因此您应该期望偏差在 100% 左右。
如果您重读 pdf documentation for clogit ,特别是的第二段固定效应 logit 部分下 备注及实例 你会看到如何clogit避免了这个问题。
由于使用 logit 的偏差你所做的是 100% 相对于 clogit您记录的估计系数之间的关系是两个估计量的预期行为(或在 logit 情况下实际上是不当行为)。

关于regression - Stata clogit 命令与带有手动固定效果的 logit 不能(完全)重现 : Coefficients double,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63154312/

46 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com