r - 计算面板数据中一个时期到另一个时期的匹配观察百分比-6ren

r - 计算面板数据中一个时期到另一个时期的匹配观察百分比

转载作者：行者123 更新时间：2023-12-05 02:33:55

25

4

我有一个按以下方式构建的时间序列面板数据集:有多个基金，每个基金拥有多只股票，我们有一个股票值(value)列。如您所见，面板不平衡。我的实际数据集非常大，每个基金至少有 500 只股票，并且代表不同的季度，其中一些缺少季度值。

df <- data.frame(
  fund_id = c(1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2),
  stock_id = c(1,1,1,1,1,1,2,2,2,2,2,2,2,1,1,3,3,3,3),
  year_q = c("2011-03","2011-06","2011-09","2011-12","2012-03","2012-06","2011-12","2012-03","2012-06","2012-09",
           "2012-12","2013-03","2013-06","2014-09","2015-03","2013-03","2013-06","2013-09","2013-12"),
  value = c(1,2,1,3,4,2,1,2,3,4,2,1,3,1,1,3,2,3,1)
)


> df
   fund_id stock_id  year_q value
1        1        1 2011-03     1
2        1        1 2011-06     2
3        1        1 2011-09     1
4        1        1 2011-12     3
5        1        1 2012-03     4
6        1        1 2012-06     2
7        1        2 2011-12     1
8        1        2 2012-03     2
9        1        2 2012-06     3
10       1        2 2012-09     4
11       1        2 2012-12     2
12       1        2 2013-03     1
13       1        2 2013-06     3
14       2        1 2014-09     1
15       2        1 2015-03     1
16       2        3 2013-03     3
17       2        3 2013-06     2
18       2        3 2013-09     3
19       2        3 2013-12     1

我想为每个基金计算当前季度持有的股票占前一到三个季度持有的股票的百分比。所以基本上对于每个基金和每个日期，我希望有 3 个列，分别是过去的第 1 季度、过去的 2 季度和过去的 3 季度，这些列显示了在过去的每个季度中也存在该日期持有的股票的百分比。
结果应该是这样的:

result <- data.frame(
  fund_id = c(1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2),
  year_q = c("2011-03","2011-06","2011-09","2011-12","2012-03","2012-06","2012-09","2012-12","2013-03","2013-06",
               "2013-03","2013-06","2013-09","2013-12","2014-03","2014-06","2014-09","2014-12","2015-03"),
  past_1Q = c("NA",1,1,0.5,1,1,0.5,1,1,1,"NA",1,1,1,"NA","NA","NA","NA","NA"),
  past_2Q = c("NA","NA",1,0.5,0.5,1,0.5,0.5,1,1,"NA","NA",1,1,"NA","NA","NA","NA","NA"),
  past_3Q = c("NA","NA","NA",0.5,0.5,0.5,0.5,0.5,0.5,1,"NA","NA","NA",1,"NA","NA","NA","NA","NA")
)

> result
   fund_id  year_q past_1Q past_2Q past_3Q
1        1 2011-03      NA      NA      NA
2        1 2011-06       1      NA      NA
3        1 2011-09       1       1      NA
4        1 2011-12     0.5     0.5     0.5
5        1 2012-03       1     0.5     0.5
6        1 2012-06       1       1     0.5
7        1 2012-09     0.5     0.5     0.5
8        1 2012-12       1     0.5     0.5
9        1 2013-03       1       1     0.5
10       1 2013-06       1       1       1
11       2 2013-03      NA      NA      NA
12       2 2013-06       1      NA      NA
13       2 2013-09       1       1      NA
14       2 2013-12       1       1       1
15       2 2014-03      NA      NA      NA
16       2 2014-06      NA      NA      NA
17       2 2014-09      NA      NA      NA
18       2 2014-12      NA      NA      NA
19       2 2015-03      NA      NA      NA

我尝试使用 rollapply 执行此操作，但无法获得正确的结果。我知道这可能不是最好的样本数据，但在我的真实数据中，每个基金通常有 500 多只股票，我预计一个时期与过去时期的匹配股票的百分比平均约为 0.95。

这是我必须获得前两个结果列的内容(归功于@r2evans):

result <- df %>%
  group_by(fund_id) %>%
  mutate(miny = min(year_q), maxy = max(year_q)) %>%
  distinct(fund_id, miny, maxy) %>%
  group_by(fund_id) %>%
  mutate(across(c(miny, maxy), ~ as.Date(paste0(., "-01")))) %>%
  transmute(year_q = purrr::map2(miny, maxy, ~ format(seq(.x, .y, by = "3 months"), format = "%Y-%m")))  %>%
  tidyr::unnest(year_q) %>%
  full_join(df, by = c("fund_id", "year_q")) %>%
  distinct(fund_id, year_q) %>%
  arrange(fund_id, year_q)

最佳答案

library(tidyverse)

df %>%
  mutate(year_q = as.Date(paste0(year_q, '-01'))) %>%
  group_by(fund_id, year_q) %>%
  summarise(stock_id = list(unique(stock_id))) %>%
  complete(year_q = seq(min(year_q), max(year_q), by = "3 months")) %>%
  reduce(.init = ., 1:3, ~ mutate(.x, "past_{.y}Q" := map(1:n(), \(N) unlist(stock_id[pmax(N-.y, 0)])))) %>%
  mutate(across(contains("past"), \(past) map2_dbl(stock_id, past, ~ mean(.x %in% .y)) %>% replace_na(0))) %>%
  ungroup()

# A tibble: 19 × 6
   fund_id year_q     stock_id  past_1Q past_2Q past_3Q
     <dbl> <date>     <list>      <dbl>   <dbl>   <dbl>
 1       1 2011-03-01 <dbl [1]>     0       0       0  
 2       1 2011-06-01 <dbl [1]>     1       0       0  
 3       1 2011-09-01 <dbl [1]>     1       1       0  
 4       1 2011-12-01 <dbl [2]>     0.5     0.5     0.5
 5       1 2012-03-01 <dbl [2]>     1       0.5     0.5
 6       1 2012-06-01 <dbl [2]>     1       1       0.5
 7       1 2012-09-01 <dbl [1]>     1       1       1  
 8       1 2012-12-01 <dbl [1]>     1       1       1  
 9       1 2013-03-01 <dbl [1]>     1       1       1  
10       1 2013-06-01 <dbl [1]>     1       1       1  
11       2 2013-03-01 <dbl [1]>     0       0       0  
12       2 2013-06-01 <dbl [1]>     1       0       0  
13       2 2013-09-01 <dbl [1]>     1       1       0  
14       2 2013-12-01 <dbl [1]>     1       1       1  
15       2 2014-03-01 <NULL>        0       0       0  
16       2 2014-06-01 <NULL>        0       0       0  
17       2 2014-09-01 <dbl [1]>     0       0       0  
18       2 2014-12-01 <NULL>        0       0       0  
19       2 2015-03-01 <dbl [1]>     0       1       0

关于r - 计算面板数据中一个时期到另一个时期的匹配观察百分比，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/70854113/

25

4

0

文章推荐： python - 为什么 str.contains 和 np.where 返回奇怪的结果？

文章推荐： string - PowerShell 我想在特定字符序列后截断一个字符串

文章推荐： css - 是否可以使用 Tailwind CSS 链接伪类？

sorting - 如何在SAS中不进行排序的情况下删除重复的记录\观察？
我想知道是否有一种方法可以重复记录而不进行排序？有时候，我想保持原始顺序，只想删除重复的记录。是否可以？顺便说一句，以下是我所知道的有关重复记录的信息，这些记录最终会进行排序。 1。 proc s
java - 观察 for 循环内的实时数据
我想更新我的 Activity 中依赖于另一个列表的数据的列表。这两个数据列表都是从我的 View 模型的 Activity 中观察到的。从第一个列表获取数据后，我需要在此列表上运行 for 循环以获
javascript - 在函数内等待/观察
我无法理解这个问题。我怎样才能等待 i==2 完成然后再继续其他 i 的操作？ class Observable { constructor() { this.observer
javascript - 观察 @each 时了解哪个项目触发事件
我正在观察这样的 Ember Data RecordArray: myArray: function() { return MyRecord.find(); }.property(), isDir
ios - 观察 'strokeEnd'层动画事件
我想在动画开始时观察 strokeEnd 键路径。但是它不起作用，我哪里出错了？ - (void)addAnimation { // do animation CABasicAnima
javascript - 观察 Algorand 上的交易
是否可以在 Algorand 中观看某个交易，就像在以太坊中观看某个事件一样？最佳答案官方 algod 和 indexer API 目前不支持在 Algorand 上观看交易/事件。您可以通过使
swiftui - 观察 SwiftUI 中的框架变化
我有一个可以拖放到其他 View 之上的 View (可以说是类别)。为了检测我在哪个类别 View 之上，我将它们的帧存储在一个帧数组中，这发生在它们不可见叠加层的 onAppear 中。 (这基于
jquery - 观察 jQuery 中的显示变化
是否可以将观察者添加到可见性更改(即调用 show() 和 hide())时触发的 DOM 元素？谢谢! 最佳答案如果您想观察任何对 .show() 或 .hide() 的调用，并且可以访问 jQu
iphone - 观察 NSUserDefaults 键的值更改
我对保存在 NSUserdefaults 中的特定键的值变化感兴趣。然而，我所拥有的并不适合我。 observeValueForKeyPath 不会被触发。更新:我想我已经发现了这个问题。如果我使用
iphone - 观察 UITableView 中的捏合多点触控手势
我正在寻找在 UITableView 顶部实现捏入/捏出，我已经研究了几种方法，包括这个: Similar question 但是，虽然我可以创建一个 UIViewTouch 对象并将其覆盖到我的 U
cocoa - 观察 NSMutableArray - 仅使用数组访问器
我有一个在界面中公开的可变数组。我还公开了数组访问器来修改数组。如果数组内发生任何修改，我将不得不使用 KVO 重置并重新计算一些数据。为了支持 KVO，我使用 array accessors如下图:
iphone - 观察 NSPopupButton 的变化
当 NSPopupButton 发生变化时如何获得方法调用？谢谢! 最佳答案您只需添加一个操作方法，就像使用 NSButton 或任何其他控件一样。关于iphone - 观察 NSPopupBut
cocoa - 观察 Cocoa 中的键值对多关系
我正在尝试让键值观察适用于 NSMutableArray。下面是被观察类 MyObservee 的 .h 文件: @interface MyObservee : NSObject { @pri
javascript - 观察 NodeJS 集群是否退出
我很难理解让 Node.js 进程(异步)运行但仍然触发“退出”状态，以便在 CPU 处理完成后我可以做更多事情。例如，我有一个 Google 地方信息抓取工具，可以在所有可用的 CPU 上高效地分
go - 观察 pod 状态的所有变化
我正在尝试编写行为类似于kubectl get pods --watch . 这样，每次 pod 的状态发生变化时，我都会被触发。我创建了一个 go项目(在集群中运行)并添加以下代码: podsWa
javascript - 观察 div 何时隐藏或显示
我有这个代码: 当时我需要触发Javascript方法或具有给定 id 的 div 隐藏或显示，这将在屏幕调整大小期间发生(因此 u k-hidden-small )，这可以
couchbase - 观察 Couchbase 文档更改的推荐方法是什么？
我想使用 Couchbase，但我想在一些类似于 RethinkDB 的方式实现更改跟踪。似乎有很多方法可以将更改从 Couchbase 服务器推送给我。 DCP 点击 XDCR 哪一个是正确的选择
javascript - 观察 HTMLElements 上的隐式大小变化
虽然 MutationObserver 允许监视 HTMLElement 属性的显式大小更改，但它似乎没有一种方法/配置允许我监视其大小的隐式更改，这些更改是由浏览器。这是一个例子: const o
AngularJS 观察 DOM 变化
我有一个 auto-carousel 指令，它循环访问链接元素的子元素。但是，子级尚未加载到 DOM 中，因为它们的 ng-if 表达式尚未解析。如何确保父指令知道其 DOM 树已发生更改？
javascript - 观察 AngularJS 指令中函数的值
有没有办法观察 AngularJS 指令中函数表达式的值变化？我有以下 HTML 和 JavaScript，模板中 {{editable()}} 的插值显示该值计算为 true，而检查 Chrome

首页

博学

6Ren·AI

商城

r - 计算面板数据中一个时期到另一个时期的匹配观察百分比