R - 从长到宽再回到相同的长格式-6ren

R - 从长到宽再回到相同的长格式

转载作者：行者123 更新时间：2023-12-01 04:48:49

29

4

我有长格式的 Compustat 数据，我通过 spread 将其转换为宽格式(来自 tidyr 包)。

然后我做了一些计算，之后我想再次将数据帧恢复为长格式。是否有任何类型的“内存”功能，以便我的新长数据帧与旧数据帧的方式完全相同(相同的顺序)。

问题是有很多 NA s，每只股票的数据从该股票首次上市时开始，到退市后或样本结束时结束。我的样本从 1960 年到 2015 年(每季度)。当然，并非所有股票都有所有这些日期的数据，但是当我从宽格式返回到长格式时，每只股票都会获得从 1960.1 到 2015.4 的所有日期。这个长格式数据帧是我正在构建的分数的一部分，我必须将它与其他长格式数据帧进行比较(所有这些数据帧都具有相同的 kypermno 和日期顺序)，因此我需要将宽数据帧转换回与新值完全相同的原始形式。

编辑:这是我的问题的一个例子:

长格式“原始”(称为“测试”):

    `kypermno fyyyyq ROE_Q
      <int>  <int> <dbl>
1      1001   1985  0.56
2      1001   1986  0.43
3      1001   1987  0.78
4      1001   1988    NA
5      1001   1989  0.34
6      1001   1990  0.76
7      1002   1980  0.12
8      1002   1981  0.67
9      1002   1982  0.12
10     1002   1983  0.56
11     1002   1984    NA
12     1002   1985  0.91
13     1002   1986  0.45
14     1002   1987  0.23
15     1002   1988  0.54
16     1002   1989  0.14
17     1002   1990  0.19
18     1002   1991  0.27`

使用以下代码，我将其放在宽格式中:

dat_wide <- spread(test, kypermno, ROE_Q)

现在在宽格式中它看起来像这样:

 fyyyyq `1001` `1002`
*   <int>  <dbl>  <dbl>
1    1980     NA   0.12
2    1981     NA   0.67
3    1982     NA   0.12
4    1983     NA   0.56
5    1984     NA     NA
6    1985   0.56   0.91
7    1986   0.43   0.45
8    1987   0.78   0.23
9    1988     NA   0.54
10   1989   0.34   0.14
11   1990   0.76   0.19
12   1991     NA   0.27

当我把它放回长格式时，它变成了这样:

dat_long <- gather(dat_wide, key = 'fyyyyq', value = 'ROE_Q', -kypermno)

fyyyyq kypermno ROE_Q
    <int>    <chr> <dbl>
1    1980     1001    NA
2    1981     1001    NA
3    1982     1001    NA
4    1983     1001    NA
5    1984     1001    NA
6    1985     1001  0.56
7    1986     1001  0.43
8    1987     1001  0.78
9    1988     1001    NA
10   1989     1001  0.34
11   1990     1001  0.76
12   1991     1001    NA
13   1980     1002  0.12
14   1981     1002  0.67
15   1982     1002  0.12
16   1983     1002  0.56
17   1984     1002    NA
18   1985     1002  0.91
19   1986     1002  0.45
20   1987     1002  0.23
21   1988     1002  0.54
22   1989     1002  0.14
23   1990     1002  0.19
24   1991     1002  0.27

正如您所看到的，现在有更多的 NA(因为它们是从长到宽创建的)并且 NA omit 不是一种选择，因为所有 NA 都被省略了(不仅是新创建的)。
因此，当我再次从宽格式返回到长格式时，我想获得旧的(18 行长)长格式数据帧，而不是我得到的(有 24 行和"new"NA)。

我希望我的问题现在可以理解了。

PS:正如你所看到的，我没有设法在第一列中获得 kypermno，在第二列中获得 fyyyyq(回到长格式后)，但我认为它不会影响上述问题。

最佳答案

有一个fill=选项，允许您选择用于“填充”间隙的值。可悲的是，它也取代了原来的 NA，所以它是无用的。

这是一个不雅的解决方案，使用原始测试数据来消除最初不存在的情况。

注意:我必须稍微修改您的代码才能使其正常工作。

test <- read.table(text = 
'ID kypermno fyyyyq ROE_Q
1      1001   1985  0.56
2      1001   1986  0.43
3      1001   1987  0.78
4      1001   1988    NA
5      1001   1989  0.34
6      1001   1990  0.76
7      1002   1980  0.12
8      1002   1981  0.67
9      1002   1982  0.12
10     1002   1983  0.56
11     1002   1984    NA
12     1002   1985  0.91
13     1002   1986  0.45
14     1002   1987  0.23
15     1002   1988  0.54
16     1002   1989  0.14
17     1002   1990  0.19
18     1002   1991  0.27',
header = TRUE)
test <- test[,-1]

library(tidyr)
dat_wide <- spread(test, kypermno, ROE_Q)
dat_wide

dat_long <- gather(dat_wide, key = 'kypermno', value = ROE_Q, -fyyyyq)
dat_long


# Keep only the original data
dat_long[ paste(dat_long[,2], dat_long[,1]) %in% paste(test[,1], test[,2]),]

# Alternative (shorter and probably better)
merge(test[,1:2], dat_long, all.x=TRUE)

但也许您应该问问自己是否真的有必要以宽格式转换数据......

关于R - 从长到宽再回到相同的长格式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43826767/

29

4

0

文章推荐： azure - 从 Azure 资源管理器模板中的资源组获取标签

文章推荐： biml - 为 ScriptComponentProject 设置 .NET Framework 版本

文章推荐： regex - 查找除版本号以外的所有内容

文章推荐： python-3.x - python生成的grpc脚本没有模块错误

c++ - 回到 C++
我最后一次使用C++是在它无法被管理之前。不过最近，我从 Java 回来，看到现在可以管理 C++ 了! 没过多久我就意识到gcnew 和^ 的用途。但是，我对容器有点卡住了。如何创建一个容器，其元
c++ - 回到 Windows 编程
我离开 Microsoft 堆栈已有一段时间了，专注于 Linux、开源内容和 PHP 中的 Web 开发。我曾经在 Dev Studio(所有 C 和 C++)中在 Windows 上进行一些桌面应
ios - 回到 ViewController 时委派丢失
在我的程序中有两个 View Controller 。第一个有表格 View 。当我单击一个单元格时，相关的炎症会显示在第二个 View Controller 中。它运作良好。当我返回到第一个 Vi
ios - CIImage 回到 CMSampleBuffer
我使用 AVAssetWriter 和 CMSampleBuffer 数据(来自视频、音频输入)录制视频(.mp4 文件)。在录制时我想处理帧，我正在将 CMSampleBuffer 转换为 CII
python - 回到 python 中的一个中断循环
在 python 中有两种不同的离开循环的选项。 continue 将您带回到循环的开头，break 就像一个电灯开关，它会在脚本运行的剩余时间内切断循环。我的问题是我有一个 while True 循
git - 回到 SourceTree 中的上一个提交
我是 Git 的新手，我正试图恢复到 SourceTree 中的先前提交。我右键单击要还原到的提交，然后单击 checkout 。它给了我一个提示，说我的工作副本将成为一个独立的头。这是什么意思，这是
ruby-on-rails - 回到 Rails
所以我决定在离开几年后，为了我的一些个人项目重新使用 Ruby on Rails。我想知道的是，找出 Rails 中的新功能的最佳资源是什么？自从 1.2 是新的以来，我什至没有真正接触过 Rails
uiview - 从 SKView 回到 UIView
我的项目有两个部分。第一部分是在 Storyboard中制作的，第二部分是 SKView。如何从 SKView 中的第二部分返回到主 UIView？最佳答案创建自定义 ViewController
git - 回到 Android Studio 中的上一个提交
所以我在大约四次提交前对我的项目做了一个糟糕的改变。我了解到我可以恢复到之前描述的状态 here ，并通过依次检查以前的提交(并在我的设备上测试它们)，我已经确定了问题发生的位置。现在我想回到坏改变
java - 如何从 Canvas 回到 MIDlet
我想知道，在 Canvas 的 commandAction 方法中，如何让我的命令按钮回到 MIDlet 的开始？ (基本上重新开始)。当按键触发时，我将它带到一个新的列表页面。在该页面上，我有一个
javascript - 回到 intro.js 行
我想知道是否可以使用 intro.js 返回到下一行。我尝试了\n 和其他类似的东西，但它们中的任何一个都有效并且不可能在文档中找到类似的东西。有谁知道这是否可能？最佳答案正确的做法是像这样使用
android - 回到 FragmentActivity 后出现 IllegalStateException
这是关于我发现我的应用程序面临的一个反复出现的问题，它与使用几个 DialogFragment 相关。我主要针对平台级别 8 设备，因此要使用 DialogFragments，我必须使用兼容性库。每
ios - 在代码中重新加载标签后，uiview 回到 Storyboard中的第一个位置
我有一个 uiview 的问题，它放置在 Storyboard的一个位置，在应用程序启动后，我将 uiview 移动到第二个位置，并使用代码中的按钮进行动画处理。 int alpha = -212;
ios - 回到 UIViewController 不会触发 segue
我有 Controller B，它使用委托(delegate)模式将数据发送回 Controller A，但由于某种原因我的 segue 没有触发。是否有什么东西阻止我的 segue 被触发？我将如
javascript - 回到 iframe 的历史记录，但更改主窗口的地址
我已经找到了处理除我需要的之外的所有内容的解决方案。这是场景就像在 GMail 中一样 - 主要内容呈现在 iframe 中。单击主页上的链接会指向 iframe。这效果很好，而且无缝。此时，如果我
java - 回到 eclipse rcp 中的启动屏幕
我有一个 RCP 程序，带有需要登录的启动屏幕。我想制作一个注销按钮。通过单击此按钮，用户应该返回到初始屏幕，因此他必须重新登录.. 这可能吗？提前致谢。最佳答案如果您使用org.eclips
python - Pandas Groupby 回到 DataFrame
我有一个数据框: df = pd.DataFrame({'Section': [1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 6],
jquery - mouseleave() 回到 mouseenter() 之前
是否可以将元素 $("p") 返回到应用 mouseenter() 方法之前的确切颜色？或者我是否需要知道 mouseenter() 之前的颜色，然后使用 mouseleave() 应用该颜色？我希望
matlab - 回到 Matlab R2016b 中的旧显示格式
在 Matlab R2016b 中，显示某些数据类型的变量会显示有关该类型的信息。当通过不带最终分号键入变量来显示变量时会发生这种情况(使用 disp 函数时不会发生这种情况)。比较例如: Matl
ruby - 回到 rspec-mocks 中的原始方法
是否可以告诉 RSpec::Mocks 为一组值 stub 一个方法，否则回退到原始方法？例如: File.stub(:exist?).with(/txt/).and_return(true) Fil

首页

博学

6Ren·AI

商城

R - 从长到宽再回到相同的长格式