gpt4 book ai didi

r - 使用 R 计算面板数据中自上次事件以来的运行次数

转载 作者:行者123 更新时间:2023-12-01 10:00:50 26 4
gpt4 key购买 nike

我希望您能帮助我使用 R 编程语言创建一个变量,该变量将计算自另一个变量的最后一个事件以来的“运行”。我正在使用的数据集是国家/地区年面板数据,并且是不平衡的。

我将在下面说明我想做什么。 COUNTRY和YEAR分别是截面标识和时间单位。 COUNTRYYEAR 是两个变量的串联,为每个独特的观察结果创建一个索引。

设 EVENT 为二进制指示符,标记感兴趣的事件是否存在 (EVENT = 1) 或不存在 (EVENT = 0)。让 COUNTZERO 成为一个离散计数变量,标记自上次观察到 EVENT 变量 1 以来的时间(此处:年)。令 COUNTONE 为另一个离散计数变量,标记 EVENT 变量的连续计数。我想要一个如下所示的数据框:

COUNTRYYEAR COUNTRY YEAR EVENT COUNTZERO COUNTONE
10011950 1 1950 1 0 1
10011951 1 1951 1 0 2
10011952 1 1952 0 1 0
10011953 1 1953 0 2 0
10011954 1 1954 0 3 0
10011955 1 1955 0 4 0
10011956 1 1956 0 5 0

....

10021950 2 1950 1 0 1
10021951 2 1951 0 1 0
10021952 2 1952 1 0 1
10021953 2 1953 0 1 0
10021954 2 1954 0 2 0
10021955 2 1955 0 3 0
10021956 2 1956 0 4 0

....

10031975 3 1975 1 0 1
10031976 3 1976 1 0 2
10031977 3 1977 1 0 3
10031978 3 1978 1 0 4
10031979 3 1979 0 1 0
10031980 3 1980 0 2 0

....

数据继续。面板数据不平衡。有些国家在一开始就被观察到(在我的插图中:1950 年),而其他国家则没有。有些国家在时间域的右端之前就退出了,而其他国家则没有。有些国家/地区在事件中全为零,有些国家/地区全为 1。

我怎样才能从我当前拥有的 EVENT 变量创建那些运行计数变量?我看了this solution ,但是,在运行该示例之后,它并没有完全创建我想要创建的向量。

任何输入将不胜感激。

此说明的可重现代码如下。

country <- c(1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3) 
year <- c(1950, 1951, 1952, 1953, 1954, 1955, 1956, 1950, 1951, 1952, 1953, 1954, 1955, 1956, 1957, 1958, 1975, 1976, 1977, 1978, 1979)
event <- c(1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 0)
Data=data.frame(country=country, year=year, event=event)

最佳答案

您可以结合使用 rleseq

reps <- c(10, 9, 3)
offsets <- unlist(sapply(reps, seq))
dat <- data.frame(country = rep(1:3, reps), year = 1950 + offsets, event = rbinom(sum(reps), 1, .5))

o <- rle(dat$event)
sequence <- unlist(sapply(o$lengths, seq))
dat$countzero <- sequence
dat$countzero[dat$event != 0] <- 0
dat$countone <- sequence
dat$countone[dat$event != 1] <- 0

给出

> dat
country year event countzero countone
1 1 1951 0 1 0
2 1 1952 0 2 0
3 1 1953 0 3 0
4 1 1954 0 4 0
5 1 1955 1 0 1
6 1 1956 0 1 0
7 1 1957 0 2 0
8 1 1958 1 0 1
9 1 1959 0 1 0
10 1 1960 1 0 1
11 2 1951 0 1 0
12 2 1952 1 0 1
13 2 1953 1 0 2
14 2 1954 1 0 3
15 2 1955 1 0 4
16 2 1956 0 1 0
17 2 1957 0 2 0
18 2 1958 0 3 0
19 2 1959 1 0 1
20 3 1951 0 1 0
21 3 1952 0 2 0
22 3 1953 0 3 0

关于r - 使用 R 计算面板数据中自上次事件以来的运行次数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16488100/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com