r - 具有集群标准错误的概率 - 等效于 Stata 命令-6ren

r - 具有集群标准错误的概率 - 等效于 Stata 命令

转载作者：行者123 更新时间：2023-12-02 03:28:27

26

4

我在 Stata 中有以下 probit 命令并在 R 中查找等效代码:

probit mediation viol ethniccomp  lncrisisdur  lncapratio  lnten_mean durable_avg neighbors totaldem_nbrhd geostr medprev jointdem if newcrisis==1, cluster(crisno)

我能够复制系数的估计结果，但是，不能复制校正后的标准误差(它们是聚类的)

probit.3.1_1 <- glm(mediation ~           viol+ethniccomp+lncrisisdur+lncapratio+lnten_mean+durable_avg+neighbors+
                    totaldem_nbrhd+geostr+medprev+jointdem,
                    data=as.data.frame(basedata[basedata$newcrisis==1,]), family=binomial (link=probit))

我基本上是在 R 中寻找 Stata 选项 cluster(crisno) 的等价物。

我看过这个reply ，但据我所知，所提出的解决方案仅涉及 logit，而不是 probit。

最佳答案

我不知道解析解，所以我会在 R 中使用 boot 包中的 boot block Bootstrap 。

这是我将作为基准测试的 Stata 代码。

cd "C:\Users\Richard\Desktop\"
use "http://www.ats.ucla.edu/stat/stata/dae/binary.dta", clear
generate group = int((_n - 1) / 20) + 1
probit admit gpa gre, vce(cluster group)
outsheet using "binary.txt", replace

这里是 R 中的等效项。第二个 block 提供了 group 上的 block Bootstrap ，这是我在 Stata 中创建的随机聚类变量。

setwd("C:/Users/Richard/Desktop/")
df <- read.delim("binary.txt")

# homoskedastic
probit <- glm(admit ~ gpa + gre, data=df, family=binomial(link=probit)) 

# with block bootstrap using `boot` package
library(boot)
myProbit <- function(x, y) {
    myDf <- do.call("rbind", lapply(y, function(n) subset(df, group == x[n])))
    myModel <- glm(admit ~ gpa + gre, data=myDf, family=binomial(link=probit))
    coefficients(myModel)
}
groups <- unique(df$group)
probitBS <- boot(groups, myProbit, 500)

# comparison
summary(probit)
probitBS

它们非常接近(Stata 结果后跟 R block Bootstrap 结果)。

Probit regression                                 Number of obs   =        400
                                                  Wald chi2(2)    =      24.03
                                                  Prob > chi2     =     0.0000
Log pseudolikelihood =   -240.094                 Pseudo R2       =     0.0396

                                 (Std. Err. adjusted for 20 clusters in group)
------------------------------------------------------------------------------
             |               Robust
       admit |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         gpa |    .454575   .1531717     2.97   0.003     .1543641    .7547859
         gre |   .0016425   .0006404     2.56   0.010     .0003873    .0028977
       _cons |  -3.003536    .520864    -5.77   0.000    -4.024411   -1.982662
------------------------------------------------------------------------------

> probitBS

ORDINARY NONPARAMETRIC BOOTSTRAP


Call:
boot(data = groups, statistic = myProbit, R = 500)


Bootstrap Statistics :
        original        bias     std. error
t1* -3.003535745 -3.976856e-02 0.5420935780
t2*  0.454574799  3.781773e-03 0.1530609943
t3*  0.001642537  4.200797e-05 0.0006210689

关于r - 具有集群标准错误的概率 - 等效于 Stata 命令，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28908783/

26

4

0

文章推荐： alertifyjs - 如何在 AlertifyJS 中指定辅助按钮的 Action ？

文章推荐： ant - 如何生成 Ant 目标？

文章推荐： angularjs - Angular 路由/路径更改和范围问题

文章推荐： pygame - 如何在pygame表面窗口中切换全屏

stata - Stata 12中gen和egen有什么区别？
为什么有两个不同的命令来生成新变量的原因？有什么简单的方法可以记住何时使用gen和何时使用egen？最佳答案它们都创建一个新变量，但是使用不同的函数集。当您对数据集中的其他变量进行简单转换时，通
stata - Stata 中的标量运算
给我谜语: scalar bah = .1*1000.01 display bah 1 scalar list bah = 100.001 display 似乎是故意显示错误的数字。
stata - 如何在 Stata 中对局部宏进行子集化
假设我有一个包含一些变量名的本地宏 local indep "cat dog pig" 如果我希望宏只包含 cat 和 dog，如何从宏中删除 pig？最佳答案上下文是您想要从列出它们的字符串中删
stata - 在 Stata 中将值标签大写
一些数据集带有全小写的值标签，我最终得到的图表和表格显示了“埃及”、“约旦”和“沙特阿拉伯”的结果，而不是大写的国家名称。我猜是proper() string 函数可以为我做一些事情，但我没有找到正
stata - 寻找一个示例程序来测试 Stata/MP
我最近购买了在 Linux 服务器上运行的 Stata MP12(8 核)许可证。有没有人写过 Stata 程序，比如说模拟研究来测试 Stata MP 的性能？我想监视在作业处理过程中实际使用的内
stata - Stata 中的嵌套循环中的 "{ required"
我不想用这个问题来打扰你们，但我收到错误“{ required”，即使我的所有循环似乎都正确打开(和关闭)，不幸的是 Stata 没有告诉你错误在哪里，所以我不明白为什么会这样。顺便说一句，如果我用
stata - Stata _b[] 中用于分类变量的后估计命令
编辑:下面提供了一个工作示例原文:后估计命令可用于预测因变量的值。这是一个示例，您可以在其中键入 _b[_cons] + _b[x1]*1 + _b[x2] 以获得 Y 的实际值。对于 Stata
stata - 如何强制 Stata 在图表中的所有其他图上方放置一条水平线？
我正在绘制时间序列并根据 Windows 7 上的 Stata 13.1 中的 bool 指标变量对某些时间段进行着色。如果指标变量等于 1，则对时间段进行着色，如果缺少则不着色。我想在 y 轴上时间
stata - Stata 的替代 IDE
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。去年关闭。 Improve this
stata - Stata 中的数组/向量等价物
熟悉 R，我想知道向量的 Stata 等价物是什么(例如 var<-c(1,2,3,4) )？我知道 Stata 使用宏，但我不知道如何在一个宏中存储多个值(创建宏的数组类型)。我想遍历一些字符串
stata - Stata 中的综合歧视指数 (IDI)
我在综合辨别力改善 (IDI) 方面得到了两个截然不同的结果。如果我使用 nriidi.pkg 包并运行 idi 我会得到此输出 . idi totaloutcome grace_prob,
stata - 如何在 Stata 中查找并替换字符串变量的一部分？
我正在使用一个基本上是 URL 的变量。因此，观察结果包括诸如此类的值 www.google.com https://www.google.com https://yahoo.movies.com
stata - 如何在 Stata 中创建引用其他字符串变量的字符串变量？
我目前有 2 个变量，state 和 year，我希望将它们转换成 1 个变量，stateyear。我希望 stateyear 变量具有以下形式的值:state_year(例如 Texas_1962
stata - 如何在 Stata 中查找和替换字符串变量的一部分？
我正在使用一个基本上是 URL 的变量。所以观察包括例如值 www.google.com https://www.google.com https://yahoo.movies.com 我正在尝试
stata - 在 Stata 中将值从一个变量传递到另一个变量
我在工作中遇到了一个问题:我合并了两个数据集，并且有许多变量具有相同的内容，但是在数据集 1 的变量中具有值的观察在数据集中具有缺失值2. 所以我需要将值从一个变量转移到另一个变量。这是我迄今为止最
stata - 如何在 Stata 中转换日期？
我有一个格式如下所示的日期，我使用 R 将它从字符串转换为日期 date <- "20 Nov 2010 21:44:00:000" strptime(date,"%d %b %Y %H:%M:%S"
stata - 如何使用 Stata 有效地创建滞后变量
我有面板数据(时间: 日期，名称: 代码)。我想为变量 x 和 y 创建 10 个滞后。现在，我使用以下代码一个一个地创建每个滞后变量: by ticker: gen lag1 = x[_n-1] 但
stata - 显示变量标签而不是变量名称 Stata 的边距图
在 Stata ，我想运行一个回归并直观地显示每个变量的系数及其相对于零的置信区间，如下所示的代码和图: sysuse auto regress price mpg weight length for
stata - 如何将标签从一个 Stata 文件导入和使用到当前文件？
我有一个带有变量 x 的文件 aa，该变量标有值标签 x_lab。我想在Stata文件bb的变量x上使用这个值标签: use bb, clear label value x x_lab 如何导入值标签
stata - 在 Stata 中拆分长文件路径
假设我的当前工作文件夹有一个很长的文件路径(80 多个字符): use .\random_folders_name\project1\secret_data\survey_data\big_const

首页

博学

6Ren·AI

商城

r - 具有集群标准错误的概率 - 等效于 Stata 命令