r - 使用 map2_dfr 将数据 bind

r - 使用 map2_dfr 将数据 bind_cols 在一起

转载作者：行者123 更新时间：2023-12-02 06:46:43

我有两个名为 5 和 6 的列表，如下所示:

df1:

$`5`
$`5`$`2016-01-01`
            [,1]
 [1,] -0.8357399
 [2,]  0.7793535
 [3,]  1.2425095
 [4,]  1.0564501
 [5,]  0.7351215
 [6,] -0.1976808
 [7,]  0.1692951
 [8,] -0.4280740
 [9,] -0.5507262
[10,]  1.0437385

$`5`$`2016-01-02`
             [,1]
 [1,]  0.68302631
 [2,]  1.16508889
 [3,]  1.04583836
 [4,]  0.71979517
 [5,] -0.14236742
 [6,]  0.07792941
 [7,] -0.41616267
 [8,] -0.49082834
 [9,]  1.09706485
[10,]  1.06911635

这是一些预测。我还有另一个列表，如下所示:

df2:

$`5`[[3]]
         date      wind     temp
1  2010-01-03  1.387097 42.09677
2  2010-01-04  3.225806 45.16129
3  2010-01-05  4.192308 47.34615
4  2010-01-06  8.083333 39.83333
5  2010-01-07  8.774194 33.29032
6  2010-01-08  9.709677 32.25806
7  2010-01-09 12.419355 31.16129
8  2010-01-10  1.290323 27.54839
9  2010-01-11  2.258065 31.06452
10 2010-01-12  4.967742 33.83871

$`5`[[4]]
         date      wind     temp
1  2010-01-04  3.225806 45.16129
2  2010-01-05  4.192308 47.34615
3  2010-01-06  8.083333 39.83333
4  2010-01-07  8.774194 33.29032
5  2010-01-08  9.709677 32.25806
6  2010-01-09 12.419355 31.16129
7  2010-01-10  1.290323 27.54839
8  2010-01-11  2.258065 31.06452
9  2010-01-12  4.967742 33.83871
10 2010-01-13  4.129032 40.70968

其中包含一些原始数据。我想将 df1 与 df2 结合起来，这样它看起来像这样:

$`5`[[3]]
         date      wind     temp   prediction
1  2010-01-03  1.387097 42.09677  -0.8357399
2  2010-01-04  3.225806 45.16129   0.7793535
3  2010-01-05  4.192308 47.34615   1.2425095 
4  2010-01-06  8.083333 39.83333   1.0564501
5  2010-01-07  8.774194 33.29032   0.7351215
6  2010-01-08  9.709677 32.25806  -0.1976808
7  2010-01-09 12.419355 31.16129   0.1692951
8  2010-01-10  1.290323 27.54839  -0.4280740
9  2010-01-11  2.258065 31.06452  -0.5507262
10 2010-01-12  4.967742 33.83871   1.0437385

和

$`5`[[4]]
         date      wind     temp   prediction
1  2010-01-04  3.225806 45.16129   0.68302631
2  2010-01-05  4.192308 47.34615   1.16508889
3  2010-01-06  8.083333 39.83333   1.04583836
4  2010-01-07  8.774194 33.29032   0.71979517
5  2010-01-08  9.709677 32.25806  -0.14236742
6  2010-01-09 12.419355 31.16129   0.07792941
7  2010-01-10  1.290323 27.54839  -0.41616267
8  2010-01-11  2.258065 31.06452  -0.49082834
9  2010-01-12  4.967742 33.83871   1.09706485
10 2010-01-13  4.129032 40.70968   1.09706485

最后我想将所有这些列表以长格式绑定(bind)在一起，例如:

       date      wind     temp   prediction  ID
 2010-01-03  1.387097 42.09677  -0.8357399    5
 2010-01-04  3.225806 45.16129   0.7793535    5
 2010-01-05  4.192308 47.34615   1.2425095    5
 2010-01-06  8.083333 39.83333   1.0564501    5
 2010-01-07  8.774194 33.29032   0.7351215    5
 2010-01-08  9.709677 32.25806  -0.1976808    5
 2010-01-09 12.419355 31.16129   0.1692951    5
 2010-01-10  1.290323 27.54839  -0.4280740    5
 2010-01-11  2.258065 31.06452  -0.5507262    5
 2010-01-12  4.967742 33.83871   1.0437385    5
 2010-01-04  3.225806 45.16129   0.68302631   6
 2010-01-05  4.192308 47.34615   1.16508889   6
 2010-01-06  8.083333 39.83333   1.04583836   6
 2010-01-07  8.774194 33.29032   0.71979517   6
 2010-01-08  9.709677 32.25806  -0.14236742   6
 2010-01-09 12.419355 31.16129   0.07792941   6
 2010-01-10  1.290323 27.54839  -0.41616267   6
 2010-01-11  2.258065 31.06452  -0.49082834   6
 2010-01-12  4.967742 33.83871   1.09706485   6
 2010-01-13  4.129032 40.70968   1.09706485   6

这是一个大型的单一数据框，ID 列是列表名称。

我试过以下代码:

library(purrr)
map2_dfr(df1, df2, ~map2_dfr(.x, map(.y, "date"), ~cbind(.x, date = .y)))

这不符合我的要求。

# A tibble: 40 x 4
   `2016-01-01` `2016-01-02` `2016-01-03` `2016-01-04`
          <dbl>        <dbl>        <dbl>        <dbl>
 1       -0.836       0.683        1.12          0.935
 2        0.779       1.17         1.02          0.754
 3        1.24        1.05         0.776        -0.146
 4        1.06        0.720       -0.188         0.160
 5        0.735      -0.142        0.0884       -0.465
 6       -0.198       0.0779      -0.283        -0.543
 7        0.169      -0.416       -0.453         1.10 
 8       -0.428      -0.491        1.06          1.03 
 9       -0.551       1.10         1.03          0.976
10        1.04        1.07         1.06          1.29 
# … with 30 more rows

数据:

df1 <- list(`5` = list(`2016-01-01` = structure(c(-0.835739850997925, 
0.779353499412537, 1.24250948429108, 1.0564501285553, 0.735121548175812, 
-0.197680771350861, 0.169295132160187, -0.42807400226593, -0.550726175308228, 
1.04373848438263), .Dim = c(10L, 1L)), `2016-01-02` = structure(c(0.683026313781738, 
1.16508889198303, 1.04583835601807, 0.719795167446136, -0.142367422580719, 
0.0779294073581696, -0.416162669658661, -0.490828335285187, 1.09706485271454, 
1.06911635398865), .Dim = c(10L, 1L)), `2016-01-03` = structure(c(1.12009644508362, 
1.01791954040527, 0.775721669197083, -0.187799870967865, 0.0883594155311584, 
-0.283172011375427, -0.452982068061829, 1.06388020515442, 1.02800369262695, 
1.06038355827332), .Dim = c(10L, 1L)), `2016-01-04` = structure(c(0.935240745544434, 
0.753606081008911, -0.145884394645691, 0.160260230302811, -0.464599192142487, 
-0.543198347091675, 1.10469722747803, 1.03225469589233, 0.976013004779816, 
1.28949522972107), .Dim = c(10L, 1L))), `6` = list(`2016-01-01` = structure(c(-1.05108523368835, 
0.831294775009155, 1.0468602180481, 1.4151725769043, 0.89024829864502, 
-0.23750251531601, 0.0968895554542542, -0.447583615779877, -0.885086059570312, 
1.16484880447388), .Dim = c(10L, 1L)), `2016-01-02` = structure(c(0.898594379425049, 
1.03132367134094, 1.43809175491333, 1.05361354351044, -0.204488694667816, 
0.0889829993247986, -0.42036372423172, -0.906104445457458, 1.16317582130432, 
1.13032007217407), .Dim = c(10L, 1L)), `2016-01-03` = structure(c(0.99635636806488, 
1.5137802362442, 0.92145836353302, -0.218990564346313, 0.147298634052277, 
-0.466208696365356, -0.896591305732727, 1.18873286247253, 1.10375666618347, 
1.59670341014862), .Dim = c(10L, 1L)), `2016-01-04` = structure(c(1.45108199119568, 
0.860665202140808, -0.299971401691437, 0.0754360556602478, -0.460747301578522, 
-0.947231769561768, 1.06433939933777, 1.13789772987366, 1.70162570476532, 
2.04307699203491), .Dim = c(10L, 1L))))


df2 <- list(`5` = list(structure(list(date = structure(c(14610, 14611, 
14612, 14613, 14614, 14615, 14616, 14617, 14618, 14619), class = "Date"), 
    wind = c(19.72, 3.19354838709677, 1.38709677419355, 3.2258064516129, 
    4.19230769230769, 8.08333333333333, 8.7741935483871, 9.70967741935484, 
    12.4193548387097, 1.29032258064516), temp = c(41.6, 41.9677419354839, 
    42.0967741935484, 45.1612903225806, 47.3461538461538, 39.8333333333333, 
    33.2903225806452, 32.258064516129, 31.1612903225806, 27.5483870967742
    )), row.names = c(NA, 10L), class = "data.frame"), structure(list(
    date = structure(c(14611, 14612, 14613, 14614, 14615, 14616, 
    14617, 14618, 14619, 14620), class = "Date"), wind = c(3.19354838709677, 
    1.38709677419355, 3.2258064516129, 4.19230769230769, 8.08333333333333, 
    8.7741935483871, 9.70967741935484, 12.4193548387097, 1.29032258064516, 
    2.25806451612903), temp = c(41.9677419354839, 42.0967741935484, 
    45.1612903225806, 47.3461538461538, 39.8333333333333, 33.2903225806452, 
    32.258064516129, 31.1612903225806, 27.5483870967742, 31.0645161290323
    )), row.names = c(NA, 10L), class = "data.frame"), structure(list(
    date = structure(c(14612, 14613, 14614, 14615, 14616, 14617, 
    14618, 14619, 14620, 14621), class = "Date"), wind = c(1.38709677419355, 
    3.2258064516129, 4.19230769230769, 8.08333333333333, 8.7741935483871, 
    9.70967741935484, 12.4193548387097, 1.29032258064516, 2.25806451612903, 
    4.96774193548387), temp = c(42.0967741935484, 45.1612903225806, 
    47.3461538461538, 39.8333333333333, 33.2903225806452, 32.258064516129, 
    31.1612903225806, 27.5483870967742, 31.0645161290323, 33.8387096774194
    )), row.names = c(NA, 10L), class = "data.frame"), structure(list(
    date = structure(c(14613, 14614, 14615, 14616, 14617, 14618, 
    14619, 14620, 14621, 14622), class = "Date"), wind = c(3.2258064516129, 
    4.19230769230769, 8.08333333333333, 8.7741935483871, 9.70967741935484, 
    12.4193548387097, 1.29032258064516, 2.25806451612903, 4.96774193548387, 
    4.12903225806452), temp = c(45.1612903225806, 47.3461538461538, 
    39.8333333333333, 33.2903225806452, 32.258064516129, 31.1612903225806, 
    27.5483870967742, 31.0645161290323, 33.8387096774194, 40.7096774193548
    )), row.names = c(NA, 10L), class = "data.frame")), `6` = list(
    structure(list(date = structure(c(14610, 14611, 14612, 14613, 
    14614, 14615, 14616, 14617, 14618, 14619), class = "Date"), 
        wind = c(19.72, 3.19354838709677, 1.38709677419355, 3.2258064516129, 
        4.19230769230769, 8.08333333333333, 8.7741935483871, 
        9.70967741935484, 12.4193548387097, 1.29032258064516), 
        temp = c(41.6, 41.9677419354839, 42.0967741935484, 45.1612903225806, 
        47.3461538461538, 39.8333333333333, 33.2903225806452, 
        32.258064516129, 31.1612903225806, 27.5483870967742)), row.names = c(NA, 
    10L), class = "data.frame"), structure(list(date = structure(c(14611, 
    14612, 14613, 14614, 14615, 14616, 14617, 14618, 14619, 14620
    ), class = "Date"), wind = c(3.19354838709677, 1.38709677419355, 
    3.2258064516129, 4.19230769230769, 8.08333333333333, 8.7741935483871, 
    9.70967741935484, 12.4193548387097, 1.29032258064516, 2.25806451612903
    ), temp = c(41.9677419354839, 42.0967741935484, 45.1612903225806, 
    47.3461538461538, 39.8333333333333, 33.2903225806452, 32.258064516129, 
    31.1612903225806, 27.5483870967742, 31.0645161290323)), row.names = c(NA, 
    10L), class = "data.frame"), structure(list(date = structure(c(14612, 
    14613, 14614, 14615, 14616, 14617, 14618, 14619, 14620, 14621
    ), class = "Date"), wind = c(1.38709677419355, 3.2258064516129, 
    4.19230769230769, 8.08333333333333, 8.7741935483871, 9.70967741935484, 
    12.4193548387097, 1.29032258064516, 2.25806451612903, 4.96774193548387
    ), temp = c(42.0967741935484, 45.1612903225806, 47.3461538461538, 
    39.8333333333333, 33.2903225806452, 32.258064516129, 31.1612903225806, 
    27.5483870967742, 31.0645161290323, 33.8387096774194)), row.names = c(NA, 
    10L), class = "data.frame"), structure(list(date = structure(c(14613, 
    14614, 14615, 14616, 14617, 14618, 14619, 14620, 14621, 14622
    ), class = "Date"), wind = c(3.2258064516129, 4.19230769230769, 
    8.08333333333333, 8.7741935483871, 9.70967741935484, 12.4193548387097, 
    1.29032258064516, 2.25806451612903, 4.96774193548387, 4.12903225806452
    ), temp = c(45.1612903225806, 47.3461538461538, 39.8333333333333, 
    33.2903225806452, 32.258064516129, 31.1612903225806, 27.5483870967742, 
    31.0645161290323, 33.8387096774194, 40.7096774193548)), row.names = c(NA, 
    10L), class = "data.frame")))

编辑:

我喜欢@tmfmnk 和@akrun 的两个解决方案。

(一些推理 - 主要是为了我稍后再回到这个问题)

在我的完整示例中，我收到错误 Error: Argument 2 must be length 2995920, not 2998110。当我申请时:

map2_dfr(map(df1, ~ bind_rows(.) %>%
              pivot_longer(everything(), values_to = "prediction") %>%
              select(-name)),
         map(df2, bind_rows),
         bind_cols, .id = "ID")

我将错误缩小到以下事实:

map(df1, ~bind_rows(.) %>% 
      pivot_longer(everything(), values_to = "prediction") %>% 
      select(-name))

创建 2 个包含 2995920 观察值的列表。我也分开跑；

map(processed_analysis, ~bind_rows(.))

这会创建 2 个包含 2998110 的列表。这两个数字的区别是 2190(据我所知，这只对我有意义，但它很重要，因为 2190 是列表列表之一的长度或观察值的数量列表列表之一)。

2998110/2190 = 1369 其中 1369 是我在每个列表(5 和 6) 在这个例子中。

@akrun 的解决方案:

imap_dfr(df2, ~ bind_rows(.x) %>%
        mutate(ID = .y)) %>%
    mutate(prediction = unlist(df1)) %>%
    as_tibble

给我一个由 5996220 观察值组成的数据框。这与 2998110 + 2998110 或每个列表 5 或 6 包含的观察数相同，当 1369 list of lists 已经rbind。

2998110的@akrun方案和2995920的@tmfmnk方案的区别在于2190，正好是行数的长度5 和 6 的 1369 列表之一。

2998110/1369 = 2190 是正确的，而 2995920/1369 = 2188..44 与数据不一致。

我不明白为什么这两种解决方案似乎对此处提供的数据完美运行，但对我拥有的完整数据却略有不同。

最佳答案

一个选项可能是:

map2_dfr(map(df1, ~ unlist(.) %>%
              enframe(value = "prediction") %>%
              select(-name)),
         map(df2, bind_rows),
         bind_cols, .id = "ID")

   ID    prediction date        wind  temp
   <chr>      <dbl> <date>     <dbl> <dbl>
 1 5         -0.836 2010-01-01 19.7   41.6
 2 5          0.779 2010-01-02  3.19  42.0
 3 5          1.24  2010-01-03  1.39  42.1
 4 5          1.06  2010-01-04  3.23  45.2
 5 5          0.735 2010-01-05  4.19  47.3
 6 5         -0.198 2010-01-06  8.08  39.8
 7 5          0.169 2010-01-07  8.77  33.3
 8 5         -0.428 2010-01-08  9.71  32.3
 9 5         -0.551 2010-01-09 12.4   31.2
10 5          1.04  2010-01-10  1.29  27.5
# … with 70 more rows

关于r - 使用 map2_dfr 将数据 bind_cols 在一起，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59511933/

文章推荐： r - 在 R 中，按列名而不是列号对列进行分组

文章推荐： r - 将一列分成多个变量，在 R 中具有唯一的列名

文章推荐： r - 有没有办法用一行代码来改变和创建许多新变量？

android -/数据/数据/在哪里？
初学者 android 问题。好的，我已经成功写入文件。例如。 //获取文件名 String filename = getResources().getString(R.string.filename
安卓/数据/数据/mypackage/img
我已经将相同的图像保存到/data/data/mypackage/img/中，现在我想显示这个全屏，我曾尝试使用 ACTION_VIEW 来显示 android 标准程序，但它不是从/data/dat
ios - Swift 4:无法将“数据”类型的值转换为预期的参数类型“数据”
我正在使用Xcode 9，Swift 4。我正在尝试使用以下代码从URL在ImageView中显示图像: func getImageFromUrl(sourceUrl: String) -> UII
android - 基因运动。如何从设备中提取数据库。我的/数据/数据/文件夹似乎是空的
我的 Ubuntu 安装 genymotion 有问题。主要是我无法调试我的数据库，因为通过 eclipse 中的 DBMS 和 shell 中的 adb 我无法查看/data/文件夹的内容。没有显示
php - JSON 数据 ajax 不是正确的 POST 数据
我正在尝试用 PHP 发布一些 JSON 数据。但是出了点问题。这是我的 html -- {% for x in sets %}
r - lm(数据~时间)和tslm(数据~趋势)有什么区别
我观察到两种方法的结果不同。为什么是这样？我知道 lm 上发生了什么，但无法弄清楚 tslm 上发生了什么。 > library(forecast) > set.seed(2) > tts lm(t
Spring 数据 JPA 和 Spring 数据 Elasticsearch ；找不到类型的属性索引？
我不确定为什么会这样!我有一个由 spring data elasticsearch 和 spring data jpa 使用的类，但是当我尝试运行我的应用程序时出现错误。 Error creatin
d3.js - 数据过滤器适用于 json 数据，但不适用于 csv 数据
在 this vega 图表，如果我下载并转换 flare-dependencies.json使用以下 jq 到 csv命令， jq -r '(map(keys) | add | unique) as
php - 在 .php 文件中发送 mysql 数据/mysql 数据
我正在提交一个项目，我必须在其中创建一个带有表的 mysql 数据库。一切都在我这边进行，所以我只想检查如何将我所有的压缩文件发送给使用不同计算机的人。基本上，我如何为另一台计算机创建我的数据库文件，
android - 如何使用 Android Device Monitor 的文件资源管理器查找我的应用程序/数据/数据
我有一个应用程序可以将文本文件写入内部存储。我想仔细看看我的电脑。我运行了 Toast.makeText 来显示路径，它说:/数据/数据/我的包但是当我转到 Android Studio 的 An
android - 如何从 Genymotion 的 android 模拟器访问文件/数据/数据？
我喜欢使用 Genymotion 模拟器以如此出色的速度加载 Android。它有非常好的速度，但仍然有一些不稳定的性能。如何从 Eclipse 中的文件资源管理器访问 Genymotion 模拟器
silverlight - 如果我在 setter 中使用不同的值更改绑定(bind)数据，如何刷新绑定(bind)数据
我需要更改 Silverlight 中文本框的格式。数据通过 MVVM 绑定(bind)。例如，有一个 int 属性，我将 1 添加到 setter 中的值并调用 OnPropertyChanged
youtube - 通过 YouTube 数据 API 访问公共(public)数据，无需身份验证。
我想向 Youtube Data API 提出请求，但我不需要访问任何用户信息。我只想浏览公共(public)视频并根据搜索词显示视频。我可以在未经授权的情况下这样做吗？最佳答案 YouTube
python - 无法让 twilio 显示 'from' 数据，但它会显示 'to' 数据
我已经设置了一个 Twilio 应用程序，我想向人们发送更新，但我不想回复单个文本。我只是想让他们在有问题时打电话。我一切正常，但我想在发送文本时显示传入文本，以确保我不会错过任何问题。我正在使用 p
javascript - 向客户端发送 JSON 数据？ D3.js 渲染 JSON 数据
我有一个带有表单的网站(目前它是纯 HTML，但我们正在切换到 JQuery)。流程是这样的: 接受用户的输入 --- 5 个整数通过 REST 调用网络服务在服务器端运行一些计算...并生成一个
javascript - 如何检测一个 JavaScript 文件只包含 JSON 数据，还是打算包含 JSON 数据？
假设我们有一个名为 configuration.js 的文件，当我们查看内部时，我们会看到: 'use strict'; var profile = { "project": "%Projec
javascript - 在初始 .ajax 调用之外使用 JSON 数据 - 访问剩余的 JSON 数据
这部分是对 Previous Question 的扩展我的: 我现在可以从我的 CI Controller 成功返回 JSON 数据，它返回: {"results":[{"id":"1","Sourc
ios - 删除所有 Couchbase 数据/文档 ios(或删除所有 ios 数据？)
有什么有效的方法可以删除 ios 中 CBL 的所有文档存储？我对此有疑问，或者，如果有人知道如何从本质上使该应用程序像刚刚安装一样，那也会非常有帮助。我们正在努力确保我们的注销实际上将应用程序设置为
javascript - $.post(url, 函数(数据,状态) {警报(数据)});警报()不工作
我有一个 Rails 应用程序，它与其他 Rails 应用程序通信以进行数据插入。我使用 jQuery $.post 方法进行数据插入。对于插入，我的其他 Rails 应用程序显示 200 OK。但在
javascript - 断言错误 : expected { status: 'SUCCESS' , 数据 : [] } to equal { Object (status, 数据)}
我正在为服务于发布请求的 API 调用运行单元测试。我正在传递请求正文，并且必须将响应作为帐户数据返回。但我只收到断言错误注意:数据是从 Azure 中获取的 spec.js const accou

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

r - 使用 map2_dfr 将数据 bind_cols 在一起