python - 如何在基于两列的数据框中堆叠聚合信息？-6ren

python - 如何在基于两列的数据框中堆叠聚合信息？

转载作者：行者123 更新时间：2023-12-01 06:27:33

25

4

我有一个数据框，其中有一列，其中的行我想成为自己的列，并用另一列的数据填充每一行。

我的起始数据框如下:

data = {'key':  ['AAAA-27293', 'AAAA-27293','AAAA-27293','AAAA-27293','AAAA-27293','AAAA-27293','AAAA-27293', 'BBBBB-27296','BBBBB-27296','BBBBB-27296','BBBBB-27296','BBBBB-27296','BBBBB-27296','BBBBB-27296'],

        'project_id': [ '105', '105','105','105','105','105','105', '107','107','107','107','107','107','107'],

        'create_date': [ '2019-01-02', '2019-01-02','2019-01-02','2019-01-02','2019-01-02','2019-01-02','2019-01-02', '2019-01-16','2019-01-16','2019-01-16','2019-01-16','2019-01-16','2019-01-16','2019-01-16'],

        'summary': ['Automated-email','Automated-email','Automated-email','Automated-email','Automated-email','Automated-email','Automated-email','Automated-email','Automated-email','Automated-email','Automated-email','Automated-email','Automated-email','Automated-email'],

        'description': [ 'Output', 'Output','Output','Output','Output','Output','Output','Output','Output','Output','Output','Output','Output','Output'],

        'field': [ 'issue', 'message reciever','message sender','checker','resolution','source','status','issue', 'message reciever','message sender','checker','resolution','source','status'],

        'field_value': ['task','johnsmith@yahoo','jim@gmail','None','rejected','ABC123','resolved', 'job','ian@yahoo','johnharris@aol','None','completed','ABC432','resolved'],
        }

df = pd.DataFrame(data,columns=['key','project_id','create_date','summary','description','field','field_value'])

除了列“field”和“field_value”之外，您将看到每列中的所有行值都相同。 “field”列有 7 个唯一值，我希望它们成为它们自己的列，并且每一行都应使用“field_value”中的值填充。

我希望达到的结果是:

data2 = {'key':  ['AAAA-27293', 'BBBBB-27296'],

        'project_id': [ '105', '107'],

        'create_date': [ '2019-01-02','2019-01-16'],

        'summary': ['Automated-email','Automated-email'],

        'description': [ 'Output','Output'],

        'issue': ['task','job'],

        'message reciever': ['johnsmith@yahoo','ian@yahoo'],

        'message sender': ['jim@gmail','johnharris@aol'],

        'checker': ['None','None'],

        'resolution': ['rejected','completed'],

        'source': ['ABC123','ABC432'],

        'staus': ['resolved', 'resolved']
        }

df2 = pd.DataFrame(data2,columns=['key','project_id','create_date','summary','description','issue','message reciever','message sender','checker','resolution','source','status'])

我尝试了下面的代码，但出现了错误

df.set_index(['key','project_id','create_date','summary','description','field','field_value'],drop=True).unstack('field_value')

最佳答案

尝试一下，不要将 field_value 添加到索引中，并使用不带参数的 unstack 来取消堆栈最中间的索引级别，即“field”:

df.set_index(['key','project_id',
              'create_date','summary',
              'description', 'field'])['field_value'].unstack().reset_index()

输出:

|    | key         |   project_id | create_date   | summary         | description   | checker   | issue   | message reciever   | message sender   | resolution   | source   | status   |
|---:|:------------|-------------:|:--------------|:----------------|:--------------|:----------|:--------|:-------------------|:-----------------|:-------------|:---------|:---------|
|  0 | AAAA-27293  |          105 | 2019-01-02    | Automated-email | Output        | None      | task    | johnsmith@yahoo    | jim@gmail        | rejected     | ABC123   | resolved |
|  1 | BBBBB-27296 |          107 | 2019-01-16    | Automated-email | Output        | None      | job     | ian@yahoo          | johnharris@aol   | completed    | ABC432   | resolved |

关于python - 如何在基于两列的数据框中堆叠聚合信息？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60060976/

25

4

0

文章推荐： python - 无法直接应用网格网格来创建 Surfaceplot

文章推荐： jquery - 找出 id 以 lkid 结尾的最近的隐藏输入字段

文章推荐： jquery - 当输入字段更改时获取所有隐藏字段值

文章推荐： jquery 在两个 div 之间切换

ios - UICollectionView 堆叠
如何将单元格(在 UICollectionView 中)堆叠在一起？ Feedly 做得很好，我想知道是否可以以某种方式操纵 zIndex 属性以在 UICollectionView 的导航中获得类似
css 堆叠 div
我正在尝试堆叠 div 以使用和图像显示顶部和底部淡入淡出。外部 div(“旋转器”)有一个背景图像，该图像在顶部和底部具有渐变，在中间是透明的。在中间，我想显示内容或图像，并将外部 div 背景图
CSS 堆叠 Div
我有两个动画(在 CSS 中)div，它们围绕彼此旋转。我想在中间为文本添加另一个 div。但是，如果我将 div 放在这两个中的任何一个中，它就会与父 div 一起设置动画。如果我尝试定位它，它就位
Android 堆叠 View
图中显示了我想要的 View 。最佳答案为此你可以采取 FrameLayout . 例如 - 1: 更新: 例如 - 2:精湛的示例和技巧，可在此处找到:http://w
tensorflow - 堆叠 LSTM 的初始状态结构
使用 tf.keras.layers.RNN 的 TensorFlow (1.13.1) 中多层/堆叠 RNN 的初始状态所需的结构是什么？ API？我尝试了以下方法: lstm_cell_size
r - ggplot2 - 堆叠/躲避条形图
我在制作条形图时遇到问题，其中 y 轴不是计数，而是变量的值。我使用stat=identity，这对于一个变量来说很好。但是，如果我有两个变量并且想要创建堆叠/闪避条形图怎么办？我这里有一些模拟数
r - 对路径列表中的栅格进行分组/堆叠，并提取每组的最小值
我有一个栅格路径列表(rplist = 912 raster pathe for 912 rasters (19yeras)(12months)(4weeks))如下: [1] "C:/Users
php - 堆叠 PHP 代码？
我已经完成了一个项目，现在需要更改该项目，以便在变量位于数组中时显示一个 div，如果变量不在数组中则显示另一个 div。通常我会这么做祝你愉快，但是我得到的代码已经包含大量 html 和 ph
r - ggplot2 - 堆叠/躲避条形图
我在制作条形图时遇到问题，其中 y 轴不是计数，而是来自变量的值。我使用 stat=identity，这对一个变量来说没问题。但是，如果我有两个变量并想创建一个堆叠/闪避条形图怎么办？我这里有一些
r - 对路径列表中的栅格进行分组/堆叠，并提取每组的最小值
我有一个栅格路径列表(rplist = 912 raster pathe for 912 rasters (19yeras)(12months)(4weeks))如下: [1] "C:/Users
java - 标签重叠(堆叠)有问题
我正在尝试将分数和耗时标签(scoreAndTimer)添加到我已经工作的贪吃蛇游戏代码中。问题是当我使用 ScoreAndTimer.setText(); 时它与之前的文本堆叠在一起。我尝试 se
gtk - 堆叠 GTK+ 小部件
有没有办法将 GTK+ 小部件放入堆栈中？ IE。在标签上放置一个按钮，使按钮覆盖标签的一部分。最佳答案您可以使用 GtkFixed 作为布局。这将允许您控制子小部件的确切位置，并且它们可以重叠。
java - 堆叠 ASM 访问者的正确方法是什么？
我有以下代码: for (Map.Entry e : classes.entrySet()) { ClassReader reader = e.getValue(); ClassWri
r - 根据ggplot2中类别的比例调整(堆叠)条宽
我正在尝试根据类别的计数(或比例)更改我的(堆叠)条宽，作为示例，我使用了钻石数据集。我想根据每个类别(变量 cut )的频率看到不同的宽度。我首先创建了一个变量 cut_prop然后用下面的代码绘制
c# - DispatcherTimer 堆叠 - UWP
我目前正在 UWP 中开展一个项目，我有一个 CommandBar，我想将其从 Hidden 变为 Compact 如果鼠标移动。五秒钟后(如果鼠标不移动)CommandBar 应该再次返回到Hidd
ios - 动画期间 subview 堆叠
我是 Swift 新手，并尝试在学习过程中编写一本交互式书籍。我使用 CATransform3DMakeRotation 创建了封面效果。正如您所看到的，当我堆叠 View 时，问题就出现了。如果我
android - 使用相机快照防止多项 Activity 堆叠
我已经阅读了 finish(); 命令和 FLAG_ACTIVITY_CLEAR_TOP 命令，还查看了 Common Ware 关于终止应用程序的回答，但我不确定如何放置这进入我的应用程序。基本上
c++ - 堆叠 Cg 着色器
在我的引擎中，我从成对的顶点/像素着色器文件中加载 Cg 着色器。我希望能够堆叠着色器以组合它们(照明+ Material 等)。除了将着色器分解为单独的函数然后从中创建单个着色器脚本字符串之外，您是
java - 相同的 Activity 堆叠
我有一个 Activity 应该自行完成并关闭应用程序。现在，在某些情况下，根据用户导航到 Activity 的方式而变化， Activity 正在堆叠。当 Activity 堆积时，然后调用 fin
python - 堆叠 CSV 文件的最快方法
我有 10 个具有完全相同的列和数据类型的 csv 文件。什么是最快/最有效的堆叠方式？ CSV1: col1 | col2 | col3 1 | 'a' | 0.1 2 | 'b'

首页

博学

6Ren·AI

商城

python - 如何在基于两列的数据框中堆叠聚合信息？