- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用以下数据在 R 中复制来自 Stata 的 cox 比例风险模型估计 http://iojournal.org/wp-content/uploads/2015/05/FortnaReplicationData.dta
stata中的命令如下:
stset enddate2009, id(VPFid) fail(warends) origin(time startdate)
stcox HCTrebels o_rebstrength demdum independenceC transformC lnpop lngdppc africa diffreligion warage if keepobs==1, cluster(js_country)
Cox regression -- Breslow method for ties
No. of subjects = 104 Number of obs = 566
No. of failures = 86
Time at risk = 194190
Wald chi2(10) = 56.29
Log pseudolikelihood = -261.94776 Prob > chi2 = 0.0000
(Std. Err. adjusted for 49 clusters in js_countryid)
-------------------------------------------------------------------------------
| Robust
_t | Haz. Ratio Std. Err. z P>|z| [95% Conf. Interval]
--------------+----------------------------------------------------------------
HCTrebels | .4089758 .1299916 -2.81 0.005 .2193542 .7625165
o_rebstrength | 1.157554 .2267867 0.75 0.455 .7884508 1.699447
demdum | .5893352 .2353317 -1.32 0.185 .2694405 1.289027
independenceC | .5348951 .1882826 -1.78 0.075 .268316 1.066328
transformC | .5277051 .1509665 -2.23 0.025 .3012164 .9244938
lnpop | .9374204 .0902072 -0.67 0.502 .7762899 1.131996
lngdppc | .9158258 .1727694 -0.47 0.641 .6327538 1.325534
africa | .5707749 .1671118 -1.92 0.055 .3215508 1.013165
diffreligion | 1.537959 .4472004 1.48 0.139 .869834 2.719275
warage | .9632408 .0290124 -1.24 0.214 .9080233 1.021816
-------------------------------------------------------------------------------
data <- read.dta("FortnaReplicationData.dta")
data4 <- subset(data, keepobs==1)
data4$end_date <- data4$`_t`
data4$start_date <- data4$`_t0`
levels(data4$o_rebstrength) <- c(0:4)
data4$o_rebstrength <- as.numeric(levels(data4$o_rebstrength[data4$o_rebstrength])
data4 <- data4[,c("start_date", "end_date","HCTrebels", "o_rebstrength", "demdum", "independenceC", "transformC", "lnpop", "lngdppc", "africa", "diffreligion", "warage", "js_countryid", "warends")]
data4 <- na.omit(data4)
surv <- coxph(Surv(start_date, end_date, warends) ~ HCTrebels+ o_rebstrength +demdum + independenceC+ transformC+ lnpop+ lngdppc+ africa +diffreligion+ warage+cluster(js_countryid), data = data4, robust = TRUE, method="breslow")
coef exp(coef) se(coef) robust se z p
HCTrebels -0.8941 0.4090 0.3694 0.3146 -2.84 0.0045
o_rebstrength 0.1463 1.1576 0.2214 0.1939 0.75 0.4505
demdum -0.5288 0.5893 0.4123 0.3952 -1.34 0.1809
independenceC -0.6257 0.5349 0.3328 0.3484 -1.80 0.0725
transformC -0.6392 0.5277 0.3384 0.2831 -2.26 0.0240
lnpop -0.0646 0.9374 0.1185 0.0952 -0.68 0.4974
lngdppc -0.0879 0.9158 0.2060 0.1867 -0.47 0.6377
africa -0.5608 0.5708 0.3024 0.2898 -1.94 0.0530
diffreligion 0.4305 1.5380 0.3345 0.2878 1.50 0.1347
warage -0.0375 0.9632 0.0405 0.0298 -1.26 0.2090
Likelihood ratio test=30.1 on 10 df, p=0.000827
n= 566, number of events= 86
最佳答案
正如 user20650 所注意到的,当在 Stata 选项中包含“nohr”时,您会得到与 R 中完全相同的标准误差。使用集群时,标准误差仍然存在微小差异。 user20650 再次注意到给出了差异是因为 Stata 默认标准误差乘以 g/(g − 1),其中 g 是集群的数量,而 R 不调整这些标准误差。因此,解决方案只是在 Stata 中包含 noadjust 或通过执行以下操作在 R 中调整标准误差:
sqrt(diag(vcov(surv))* (49/48))
library(msm)
se <-diag(vcov(surv)* (49/48))
sapply(se, function(x) deltamethod(~ exp(x1), coef(surv)[which(se==x)], x))
HCTrebels o_rebstrength demdum independenceC transformC lnpop lngdppc africa diffreligion warage
0.1299916 0.2267867 0.2353317 0.1882826 0.1509665 0.0902072 0.1727694 0.1671118 0.4472004 0.02901243
关于r - R vs Stata 中的 Cox 比例风险模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33966004/
为什么有两个不同的命令来生成新变量的原因? 有什么简单的方法可以记住何时使用gen和何时使用egen? 最佳答案 它们都创建一个新变量,但是使用不同的函数集。当您对数据集中的其他变量进行简单转换时,通
给我谜语: scalar bah = .1*1000.01 display bah 1 scalar list bah = 100.001 display 似乎是故意显示错误的数字。
假设我有一个包含一些变量名的本地宏 local indep "cat dog pig" 如果我希望宏只包含 cat 和 dog,如何从宏中删除 pig? 最佳答案 上下文是您想要从列出它们的字符串中删
一些数据集带有全小写的值标签,我最终得到的图表和表格显示了“埃及”、“约旦”和“沙特阿拉伯”的结果,而不是大写的国家名称。 我猜是proper() string 函数可以为我做一些事情,但我没有找到正
我最近购买了在 Linux 服务器上运行的 Stata MP12(8 核)许可证。 有没有人写过 Stata 程序,比如说模拟研究来测试 Stata MP 的性能?我想监视在作业处理过程中实际使用的内
我不想用这个问题来打扰你们,但我收到错误“{ required”,即使我的所有循环似乎都正确打开(和关闭),不幸的是 Stata 没有告诉你错误在哪里,所以我不明白为什么会这样。顺便说一句,如果我用
编辑:下面提供了一个工作示例 原文:后估计命令可用于预测因变量的值。这是一个示例,您可以在其中键入 _b[_cons] + _b[x1]*1 + _b[x2] 以获得 Y 的实际值。对于 Stata
我正在绘制时间序列并根据 Windows 7 上的 Stata 13.1 中的 bool 指标变量对某些时间段进行着色。如果指标变量等于 1,则对时间段进行着色,如果缺少则不着色。我想在 y 轴上时间
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 去年关闭。 Improve this
熟悉 R,我想知道向量的 Stata 等价物是什么(例如 var<-c(1,2,3,4) )? 我知道 Stata 使用宏,但我不知道如何在一个宏中存储多个值(创建宏的数组类型)。 我想遍历一些字符串
我在综合辨别力改善 (IDI) 方面得到了两个截然不同的结果。 如果我使用 nriidi.pkg 包并运行 idi 我会得到此输出 . idi totaloutcome grace_prob,
我正在使用一个基本上是 URL 的变量。因此,观察结果包括诸如此类的值 www.google.com https://www.google.com https://yahoo.movies.com
我目前有 2 个变量,state 和 year,我希望将它们转换成 1 个变量,stateyear。 我希望 stateyear 变量具有以下形式的值:state_year(例如 Texas_1962
我正在使用一个基本上是 URL 的变量。所以观察包括例如值 www.google.com https://www.google.com https://yahoo.movies.com 我正在尝试
我在工作中遇到了一个问题:我合并了两个数据集,并且有许多变量具有相同的内容,但是在数据集 1 的变量中具有值的观察在数据集中具有缺失值2. 所以我需要将值从一个变量转移到另一个变量。 这是我迄今为止最
我有一个格式如下所示的日期,我使用 R 将它从字符串转换为日期 date <- "20 Nov 2010 21:44:00:000" strptime(date,"%d %b %Y %H:%M:%S"
我有面板数据(时间: 日期,名称: 代码)。我想为变量 x 和 y 创建 10 个滞后。现在,我使用以下代码一个一个地创建每个滞后变量: by ticker: gen lag1 = x[_n-1] 但
在 Stata ,我想运行一个回归并直观地显示每个变量的系数及其相对于零的置信区间,如下所示的代码和图: sysuse auto regress price mpg weight length for
我有一个带有变量 x 的文件 aa,该变量标有值标签 x_lab。我想在Stata文件bb的变量x上使用这个值标签: use bb, clear label value x x_lab 如何导入值标签
假设我的当前工作文件夹有一个很长的文件路径(80 多个字符): use .\random_folders_name\project1\secret_data\survey_data\big_const
我是一名优秀的程序员,十分优秀!