gpt4 book ai didi

r - 如何为泊松回归构建分层数据

转载 作者:行者123 更新时间:2023-12-01 12:49:00 25 4
gpt4 key购买 nike

我正在尝试使用 R 对我拥有的一些数据进行泊松回归。目前数据结构如下:

数据根据三个职业进行分层。数据中有四个收入水平。在每个阶层中,每个收入水平都有

  1. 已发生的工伤事故数量,以及
  2. 观察到的总人月数。

这是一个设置示例。括号中的数字是观察到的总人月数,不在括号中的数字是工作场所事故的数量。

我的问题是如何设置这些数据并对收入水平对工伤事故发生的影响进行泊松回归?理想情况下,我想针对职业进行调整并找出仅收入的影响,但作为起点,我完全不确定如何将其设置为泊松回归问题。我考虑过用受伤人数除以观察月数之类的方法,但这样得出的值不是整数,所以我认为这不是正确的做法。

重申一下,预测指标:收入水平;响应变量:工作场所事故。

顺便说一句,如果这样做有意义的话,将括号中的数字分开并将它们放入自己的列中将非常容易。

我非常感谢有关如何设置它的任何建议。我确信其他统计学家正在处理类似结构的数据,并且可能也想获得一些见解。非常感谢!

最佳答案

@thelatemail 认为这更适合 stats.stackexchange.com 可能是正确的,但这里有一些 R 代码。该数据采用宽格式,您需要将其重新构建为长格式。 (并且您不想包括总计列。将前四列转换为长格式后,您将“职业”和“级别”作为因子类变量,事故“计数”和曝光“月份”作为数字列,您可以使用对 glm 的调用。

fit <- glm( counts ~ level + occup + offset(log(months)), data=dfrm, family="poisson")

偏移量需要进行 log() 运算,以与泊松族的默认链接函数创建的记录计数一致。

(你真的不能指望我们重做那个数据输入任务,现在可以吗?)

关于r - 如何为泊松回归构建分层数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13693817/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com