gpt4 book ai didi

r - 年份变量应该是 R 面板数据中的因子还是数字?

转载 作者:行者123 更新时间:2023-12-04 11:36:52 25 4
gpt4 key购买 nike

我有一个面板数据集,从 2004 年到 2010 年每两年对医院进行一次跟踪。数据在 Stata 中,但我将其带到 R。最初是变量 year (2004, 2006, 2008, 2010) 和 t (1=2004, 2=2006 等等) 是整数,但后来我将它们转换为因子,如下所示:

data$year <- factor(data$year)

对于 t 时间变量也是如此。

但我很困惑,我的问题是是否采取 yeart作为整数或数字变量或将其转换为面板数据的因子以及上述命令是否是转换为因子的正确方法?

最佳答案

治疗 year作为分类变量将计算每个单独年份的影响 - 即给定年份对目标变量的平均影响。另一方面,包括t因为数值变量表示平均两年后会发生什么。鉴于只有 4 个时间段,第一种方法似乎更合理,但这实际上取决于我们分析的目标。

命令应该是
data$year <- as.factor(data$year) .

另外,请确保您只包含 year 之一。或 t因为包括两者可能会搞砸解释。

关于r - 年份变量应该是 R 面板数据中的因子还是数字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26580964/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com