具有重复列类别的 Pandas 数据透视表-6ren

具有重复列类别的 Pandas 数据透视表

转载作者：行者123 更新时间：2023-12-05 01:25:55

25

4

我有一个如下所示的数据框:

df = pd.DataFrame({"Object": ['Apple', 'Orange', 'Banana', 'Grape', 'Cherry'], 
                   "Jan 01 Vol": [0, 5, 2, 4, 8],
                  "Jan 01 Price": [1.15, 2.30, 1.75, 3.4, 2.5],
                  "Jan 01 Sales": [0, 11.5, 5.25, 13.6, 20],
                  "Jan 02 Vol": [1, 2, 3, 4, 5],
                  "Jan 02 Price": [1.15, 2.30, 1.75, 3.4, 2.5],
                  "Jan 02 Sales": [1.15, 4.6, 5.25, 13.6, 12.5],
                  "Feb 01 Vol": [5, 4, 3, 2, 1],
                  "Feb 01 Price": [1.15, 2.30, 1.75, 3.4, 2.5],
                  "Feb 01 Sales": [5.75, 9.2, 5.25, 6.8, 2.5],})

我希望能够操作数据框，使“Vol”、“Price”、“Sales”成为它们自己的列，同时垂直旋转列的日期方面，使其看起来像这样:

df2 = pd.DataFrame({"Object": ['Apple', 'Apple', 'Apple', 
                               'Orange','Orange', 'Orange', 
                               'Banana', 'Banana', 'Banana', 
                               'Grape', 'Grape', 'Grape', 
                               'Cherry', 'Cherry', 'Cherry'], 
                    "Year": [2001, 2001, 2002, 
                             2001, 2001, 2002, 
                             2001, 2001, 2002, 
                             2001, 2001, 2002, 
                             2001, 2001, 2002],
                   "Month": [1, 2, 1, 
                             1, 2, 1, 
                             1, 2, 1, 
                             1, 2, 1, 
                             1, 2, 1],
                    "Vol": [0, 5, 1, 5, 4, 2, 2, 3, 3, 4, 2, 4, 8, 1, 5],
                   "Price": [1.15, 1.15, 1.15, 2.30, 2.30, 2.30, 1.75, 1.75, 1.75, 3.4, 3.4, 3.4, 2.5, 2.5, 2.5],
                   "Sales": [0, 5.75, 1.15, 11.50, 9.2, 4.6, 5.25, 5.25, 5.25, 13.60, 6.8, 13.60, 20, 2.5, 12.5]})

我考虑过使用 lambda 函数创建一个新列，从水平列名称中提取年份，但这不起作用，因为数组长度不同。我还考虑过制作数据透视表，但同样，不确定如何将列的“Vol”、“Price”、“Sales”方面解析为自己的列。任何帮助将不胜感激。

最佳答案

dfm = df.melt(id_vars='Object')

df3 = pd.concat([dfm[['Object', 'value']], dfm['variable'].str.split(expand=True)], axis=1)
df3.rename(columns={0: 'Month', 1: 'Year', 2:'Type'}, inplace=True)
df3 = df3.set_index(['Object', 'Year', 'Month', 'Type']).unstack()['value'].reset_index()
df3['Year'] = df3['Year'].astype(int)+2000
df3['Month'] = pd.to_datetime(df3['Month'], format='%b').dt.month

#Output
#Type  Object  Year  Month  Price  Sales  Vol
#0      Apple  2001      2   1.15   5.75  5.0
#1      Apple  2001      1   1.15   0.00  0.0
#2      Apple  2002      1   1.15   1.15  1.0
#3     Banana  2001      2   1.75   5.25  3.0
#4     Banana  2001      1   1.75   5.25  2.0
#5     Banana  2002      1   1.75   5.25  3.0
#6     Cherry  2001      2   2.50   2.50  1.0
#7     Cherry  2001      1   2.50  20.00  8.0
#8     Cherry  2002      1   2.50  12.50  5.0
#9      Grape  2001      2   3.40   6.80  2.0
#10     Grape  2001      1   3.40  13.60  4.0
#11     Grape  2002      1   3.40  13.60  4.0
#12    Orange  2001      2   2.30   9.20  4.0
#13    Orange  2001      1   2.30  11.50  5.0
#14    Orange  2002      1   2.30   4.60  2.0

我首先会使用pd.melt进行转换。使用.str.split使用 expand=True 将 variable 列(由 pd.melt 从列中构造)中的信息拆分为三个单独的列，并将它们重命名为有意义的名称。然后使用set_index这样我们就可以unstack ，根据需要将信息从长格式分散到三列中。最后，将日期时间特征更改为您想要的数字。

希望有帮助

关于具有重复列类别的 Pandas 数据透视表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54428768/

25

4

0

文章推荐： c - 大型 main 会使程序变慢吗？

文章推荐： .net - Jenkins 中 .NET 应用程序的控制台输出到哪里？

文章推荐： c - 指针间接与在堆栈上分配的成本是多少？

文章推荐： drupal - 为外部链接模块设置链接目标=_blank

OpenGL 透视
我正在尝试使用透视投影描绘一个立方体，但我得到的只是一个正方形的角。正方形的面设置在原点并向正方向扩展。使用 glOrtho 我可以设置坐标系，但我在使用 glPerspective 做同样的事情时遇
mysql - 子查询选择行作为列(透视)
SELECT j.departure, stopDepartures.* FROM journey j JOIN journey_day ON journey_day.journey = j.id J
MYSQL 透视/将行转换为值匹配的列
我确实需要一些帮助来了解如何根据相似的值对表格进行透视。 day | startDate ----------------------- Monday | 09:00 Monday |
python - 透视/旋转数据集的最佳方式
我有以下数据框 df = pd.DataFrame({ '1': ['Mon (07/08)','Sales', '2'], '2': ['Mon (07/0
python - 分组依据/透视
dummy_df = pd.DataFrame({ 'accnt' : [101, 102, 103, 104, 101, 102, 103, 104, 101, 102, 103, 104,
android - 3D旋转-透视
public class MainActivity extends Activity { LinearLayout rotator; protected void onCreate(Bundle sa
PHP ImageMagick Plane2Cylinder 透视
我正在尝试通过 PHP 更改 ImageMagick 中 Plane2Cylinder 失真的视角。为了帮助解释我在寻找什么，我制作了这张图: 您可以看到红色 block 的下部比顶部的半径更大，就
sql - 透视 - SQL - 来自子查询的值
我有一个像这样的简单查询.. USE AdventureWorks; GO SELECT DaysToManufacture, AVG(StandardCost) AS AverageCost FRO
mysql - 透视 MySQL 数据
我希望我可以更改架构，但我受制于它，假设我有以下表格 JanDataTable FebDataTable MarDataTable ProductsTable 其中前三个表有 ID 和 Amount
c# - 透视 3D 对象
我正在将我们的一个旧应用程序从 vb6 更新到 c#，在此过程中必须重新创建原始程序员设计的自定义控件。该控件简单地获取对象的尺寸，矩形或圆锥形，并在 3D 中放置对象的轮廓草图(我认为在技术上是 2
mysql - 透视 MySQL 表
我一直在尝试在 MySQL 中对表进行透视(将行移动到列)。我知道 mysql 没有枢纽功能，所以我认为需要联合，但不是 100% 确定。我有三列，user_id、option_id 和 Questi
mysql - 透视 mysql 表返回
我正在尝试旋转像这样创建的 mysql 表 'CREATE TABLE `fundreturns` ( `Timestamp` datetime NOT NULL, `FundName` varcha
mysql - 多连接查询，透视？烦恼
提前感谢任何对此提供帮助的人。我知道我以前做过这件事，没有太多痛苦，但似乎找不到解决方案我的数据库看起来像这样: `tbl_user: ---------- id ( pkey )
javascript - 透视 CSS3 不工作
我正在尝试开发 X 轴方向的卡片翻转动画。截至目前，div 现在只需使用 rotateX() 方法进行旋转。我试过对上层 div 使用透视属性，而不是工作它扭曲了我的 div 结构。因为，这只是一个工
CSS3 透视 z 轴可见性
我有一个带有 CSS3 透视图的 DIV 元素。 DIV 包含 2 个子 DIV，其中之一在 z 轴上有平移。这应该会导致一个 DIV 在另一个前面，因此后面的那个应该被挡住。然而，这些 DIV 的
CSS3 第二个 3D 透视
大家好，我有一张这样的 map http://sinanisler.com/demo/map/ 如您所见，有一些树，但不是真正的视角，我想要这个 http://sinanisler.com/demo/
c++ - OpenGL 平截头体、透视
我有以下代码将快照拍摄到帧缓冲区。我验证了帧缓冲区工作正常并且相机正确地面向对象。我曾经正确地完成图片，但它是基于错误的代码，使用了错误的截锥体。所以我决定重新开始(使用截锥体)。物体以中间为中心，
python - 透视 Pandas 数据并添加列
我正在尝试将求和列添加到透视数据框，但不断收到数据解析错误。 mydata = [{'amount': 3200, 'close_date':'2013-03-31', 'customer': 'Cu
c# - 透视 IEnumerable 列表
我正在尝试将一些 groupby/crosstabbing 逻辑应用于用户定义对象的 IEnumerable 列表，并且想知道是否有人可以帮助我。我坚持使用现有的(相当烦人的)对象模型来工作，但无论如
ios - CoreImage 的深度/透视？
我想使用一个 CALayer 创建如下图所示的效果 - 而不是通过拆分图像、对两半进行透视变换然后将它们并排放置。可以使用 CoreImage 以任何方式完成吗？或者，有人可以使用 OpenGL

首页

博学

6Ren·AI

商城

具有重复列类别的 Pandas 数据透视表