python - 在 Pandas 中垂直和水平堆叠数据帧-6ren

python - 在 Pandas 中垂直和水平堆叠数据帧

转载作者：行者123 更新时间：2023-12-02 01:31:52

25

4

我有一个如下所示的数据框:

  country region  region_id  year  doy  variable_a  num_pixels
0     USA   Iowa      12345  2022    1        32.2         100
1     USA   Iowa      12345  2022    2        12.2         100
2     USA   Iowa      12345  2022    3        22.2         100
3     USA   Iowa      12345  2022    4       112.2         100
4     USA   Iowa      12345  2022    5        52.2         100

上面数据框中的年份是 2022 年。从 2010 年开始，我有更多其他年份的数据框。我还有其他变量的数据框:variable_b、variable_c。

我想将所有这些数据帧组合成一个数据帧，这样

年份按顺序垂直排列
不同变量的数据水平列出。输出应如下所示:

  country region  region_id  year  doy  variable_a  variable_b  variable_c
0     USA   Iowa      12345  2010    1        32.2          44         101
1     USA   Iowa      12345  2010    2        12.2          76        2332
..........................................................................
n-1   USA   Iowa      12345  2022    1       321.2         444         501
n     USA   Iowa      12345  2022    2       122.2         756          32

实现这一目标最有效的方法是什么？请注意，其他数据帧中的年份会有重叠，因此解决方案需要考虑到这一点，而不是留下 NaN 值。

最佳答案

我不确定人们是否听到了您问题的第二部分:

the data for the different variables is listed horizontally.

和

there will be overlap in years in the other dataframes so the solution needs to take that into account and not leave NaN values.

我想我明白了，这就是我的解决方案。

我们首先创建一个为期两年、每次五天、包含两个变量的婴儿数据集。

import pandas as pd

# Baseline dummy data
data = {
    'country': {0: 'USA', 1: 'USA', 2: 'USA', 3: 'USA', 4: 'USA'},
    'region': {0: ' Iowa', 1: ' Iowa', 2: ' Iowa', 3: ' Iowa', 4: ' Iowa'},
    'region_id': {0: 12345, 1: 12345, 2: 12345, 3: 12345, 4: 12345},
    'year': {0: 2022, 1: 2022, 2: 2022, 3: 2022, 4: 2022},
    'doy': {0: 1, 1: 2, 2: 3, 3: 4, 4: 5},
    'num_pixels': {0: 100, 1: 100, 2: 100, 3: 100, 4: 100}
}

# 2022 data with "a" data
df_2022_a = pd.DataFrame(data)
df_2022_a["variable_a"] = range(5)

# 2022 data with "b" data
df_2022_b = pd.DataFrame(data)
df_2022_b["variable_b"] = range(5, 10)

# 2021 data with "a" data
df_2021_a = pd.DataFrame(data)
df_2021_a["variable_a"] = range(10, 15)
df_2021_a["year"] = 2021

# 2021 data with "b" data
df_2021_b = pd.DataFrame(data)
df_2021_b["variable_b"] = range(15, 20)
df_2021_b["year"] = 2021

frames = [df_2022_a, df_2022_b, df_2021_a, df_2021_b]

# Get the columns that they all share. This is what we'll group by.
# You can hard-code this if you want
common_cols = list(set.intersection(*(set(df.columns) for df in frames)))

# Yes, go ahead and concatenate them together... but there's one more step!
df = pd.concat(frames)
df

在这里，您留下了很多重复的日子和很多NaN。通过执行以下操作来折叠数据框:

output_df = (
    df
    .groupby(by=common_cols)  # Only keep distinct values for the common cols
    .max()                    # Max will prefer non-nan values over nans
    .reset_index()            # Collapse the multi-index
    .sort_values(common_cols) # Sort by all these to get it nice and orderly
    .reset_index(drop=True)   # Tidy up the dataframe index
)
output_df

我相信这就是 OP 所要求的输出类型。

至于最终产品中没有 NaN，这将真正取决于所有年份和日期的所有变量的数据覆盖范围。

关于python - 在 Pandas 中垂直和水平堆叠数据帧，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/73127093/

25

4

0

文章推荐： c - 有没有不是C++的 "C with classes"语言？

文章推荐： kotlin - 验证构造函数中值的组合

文章推荐： python - 如何在 pandas 中使用 count、groupby 和 max？

文章推荐： ubuntu - JSchException : Auth fail on Ubuntu 22. 04

haskell - 水平、垂直和对角线上的数字相乘
我目前正在研究一个项目欧拉问题(www.projecteuler.net)，但遇到了一个绊脚石。其中一个问题提供了一个 20x20 的数字网格，并要求直线上 4 个数字的最大乘积。这条线可以是水平的、
join - 水平 UNION ALL
我有两个表，我需要从每个表中选择一列。这必须在单个查询中完成。好消息是这两列以正确的方式排序，并且它们都包含相同数量的行。现在，我知道我可以通过 rowid 加入两个表，但它很慢，因为它必须进行
iphone - 水平 UITableView
我想在我的 iPad 应用程序中实现一个布局，该布局具有一个可左右滚动而不是上下滚动的合适 View : 所以而不是第 1 行第 2 行第 3 行(垂直滚动)这将是 :第 1 行、第 2 行、第 3
imagemagick - 并排合并图像(水平)
我有五个尺寸的图像:600x30、600x30、600x30、600x30、810x30。它们的名称分别是:0.png、1.png、2.png、3.png、4.png。如何使用 ImageMagic
java - 滚动浏览多个列表(水平)
我正在寻找一个选项来滚动多个列表(水平)，如附件中的图片所示。您可以向左或向右滑动以进入下一个 ListView 。顶部应该有一些按钮可以单击或滚动我尝试将 ListViews 放入类似此代码的内容
camera - 水平、垂直和对角线视野之间的关系
这些值之间是否存在数学关系？如果我知道 hFOV 和 vFOV，我可以计算对角 FOV 而不涉及焦距等其他值吗？我的第一个想法是使用毕达哥拉斯定理，但也许这是错误的。最佳答案感兴趣的物理量是传感
c++ - 水平/垂直均匀分布网格单元？
我正在尝试在 game_width=640 和 game_height=480 的窗口内绘制网格。网格单元的数量是预定义的。我想在水平和垂直方向上均匀分布单元格。 void GamePaint(HDC
水平 ScrollView 上的android绘图线
你好，我已经发布了我的 iphone 应用程序 Micro-Pitch，现在正在将它移植到 android 上。我不知道如何在 ScrollView 中画线，想知道我做错了什么。这是我的 Scrol
css - 对齐图像 - 水平
如果您访问我的网站:www.ryancoughlin.com - 如果您在页面右侧看到 Google、Yahoo 等 RSS 按钮。我试图让它们均匀对齐，它们的图像高度都相同，我一直试图让它们均匀对齐
javascript - 居中问题(水平)
我想将此 Material 水平居中: 最佳答案将 text-align:center 添加到您的 anchor 。我假设您的 zoom1 具有 display
html - 旋转木马共享行 - 水平
我正在努力做到这一点，以便我的旋转木马可以与其他文本共享一个水平行，但由于某种原因它无法正常工作，当它设置为 40% 时它占据了 100% 的宽度。我将在下面发布代码和屏幕截图。在上图中，它显示了
html - 如何将元素的宽度设置为从特定位置到页面末尾(水平)
问题来了。我正在尝试放置一些彼此相邻的元素。 div 的宽度s 未指定，取决于它们的内容。我正在使用下面的 CSS 代码来定位彼此相邻: #div{ height: 50px; f
css - 无法并排打印表格(水平)
我正在尝试使用这样的 Bootstrap 并排打印表格但是当我尝试打印预览时，我得到了这个我的代码如下。我尝试了所有可能的解决方案，但我不知道为什么我无法打印我看到的页面。请指导我解决这个问题。
html - 两种背景颜色(水平)
我想知道是否可以在背景中使用两种不同的颜色，并通过 Bootstrap 在每一侧扩展 100%。这是我的意思的截图，左侧为红色，右侧为深色，为更大的屏幕放大 100%。有什么简单的解决方案吗？最
javascript - jquery滚动垂直/水平
我正在尝试制作一个包含所有事件的滚动触发的整个网站。我只需要帮助来实现这种效果: 我有一个网站，其中包含一些填满所有视口(viewport)的 div，我希望用户能够向下滚动到一个命名的 div，然后
html - 按钮之间的间距相等(水平)
我的代码是 Show All Show Valid Show Pending Save Clear Download As CSV 我希望那些输入日期和按钮在 class="buttons" di
javascript - 可扩展的菜单框(水平)
我在玩这个想法: 在这个 block 中我有 2 作为按钮和并尝试了 float荷兰国际集团他们让他们粘在一起。实现这种效果的主要思想是操纵 ul 的宽度/显示状态。或者只是菜单部分。 Log
html - 如何将此幻灯片移动到页面的中心(水平)？
这个问题在这里已经有了答案: How can I horizontally center an element? (134 个回答) 关闭 4 年前。
jquery - 水平/垂直跨浏览器居中图像
我遇到了一个 CSS 问题，需要帮助。我在目录中有许多不同大小的图像，我正在动态列出它们以显示以下 View :(我仅显示两个图像作为示例) 这是我的 HTML:
android - 水平 ListView
这个问题在这里已经有了答案: 关闭 9 年前。 Possible Duplicate: How can I make a horizontal ListView in Android? 我已经多次使

首页

博学

6Ren·AI

商城

python - 在 Pandas 中垂直和水平堆叠数据帧