python - pandas 数据透视表

python - pandas 数据透视表 - 重新排列

转载作者：行者123 更新时间：2023-11-30 22:55:26

25

4

我有一个包含一些列的 pandas 数据框。我想以不同的方式重新排列它们。示例如下:

time,name,feature,value
33 20 May 2016 14:00:00 -0700,John,badL,2
45 19 May 2016 18:00:00 -0700,John,badL,1
120 17 May 2016 11:00:00 -0700,John,badL,1
220 20 May 2016 14:00:00 -0700,John,totalL,20
450 19 May 2016 18:00:00 -0700,John,totalL,15
330 18 May 2016 15:00:00 -0700,Mary,badL,2
330 18 May 2016 15:00:00 -0700,Mary,totalL,20
550 21 May 2016 12:00:00 -0700,Mary,adCmd,4
700 22 May 2016 16:00:00 -0700,Mary,PC,3
800 22 May 2016 16:00:00 -0700,Mary,eCon,200

注意:第一列值(时间)前面是索引值 (33, 45,120,...)。从上面的数据框中，我希望生成的数据框为:

time,name,badL,totalL,adCmd,PC,eCon
20 May 2016 14:00:00 -0700,John,2,20,0,0,0
19 May 2016 18:00:00 -0700,John,1,15,0,0,0
17 May 2016 11:00:00 -0700,John,1,0,0,0,0
18 May 2016 15:00:00 -0700,Mary,2,20,0,0,0
21 May 2016 12:00:00 -0700,Mary,0,0,4,0,0
22 May 2016 16:00:00 -0700,Mary,0,0,0,3,200

注意:5 月 17 日，John 没有任何总 L。所以，用0填充。

有没有一种优雅的方式来做到这一点？我将时间字段设置为 pd.to_datetime，然后进行比较......看起来很乏味。对于上面的例子，我只有两个“特征”(badL，totalL)。稍后我还会有更多。

这就是我所拥有的 - 但是，它为第二个功能添加了不同的行...(totalL)...而不是将其放在同一行中。

for f in ['badL', 'totalL']:
    dff = df[df.feature == f]
    print dff
    if len(dff.index) > 0:
        fullFeatureDf[f] = dff.feature_value

最佳答案

设置

from StringIO import StringIO
import pandas as pd

text = '''time,name,f1,value
20 May 2016 14:00:00 -0700,John,badL,2
19 May 2016 18:00:00 -0700,John,badL,1
17 May 2016 11:00:00 -0700,John,badL,1
20 May 2016 14:00:00 -0700,John,totalL,20
19 May 2016 18:00:00 -0700,John,totalL,15
17 May 2016 11:00:00 -0700,John,totalL,12
'''

df = pd.read_csv(StringIO(text))

print df

                         time  name      f1  value
0  20 May 2016 14:00:00 -0700  John    badL      2
1  19 May 2016 18:00:00 -0700  John    badL      1
2  17 May 2016 11:00:00 -0700  John    badL      1
3  20 May 2016 14:00:00 -0700  John  totalL     20
4  19 May 2016 18:00:00 -0700  John  totalL     15
5  17 May 2016 11:00:00 -0700  John  totalL     12

使用`unstack`的解决方案

df = df.set_index(['time', 'name', 'f1'])

print df

                                        value
time                       name f1           
20 May 2016 14:00:00 -0700 John badL        2
19 May 2016 18:00:00 -0700 John badL        1
17 May 2016 11:00:00 -0700 John badL        1
20 May 2016 14:00:00 -0700 John totalL     20
19 May 2016 18:00:00 -0700 John totalL     15
17 May 2016 11:00:00 -0700 John totalL     12

然后取消堆叠以执行透视。它获取行索引的一部分并将其移动为列。

print df.unstack()

                                value       
f1                               badL totalL
time                       name             
17 May 2016 11:00:00 -0700 John     1     12
19 May 2016 18:00:00 -0700 John     1     15
20 May 2016 14:00:00 -0700 John     2     20

<小时/>

本质上，这是与 Yakym Pirozhenko 相同的解决方案。只是做法略有不同。这对我来说更直观，但对你来说可能不是。

关于python - pandas 数据透视表 - 重新排列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37424539/

25

4

0

文章推荐： python - 在 Pandas 中通过不同方式聚合列来使用 groupby

OpenGL 透视
我正在尝试使用透视投影描绘一个立方体，但我得到的只是一个正方形的角。正方形的面设置在原点并向正方向扩展。使用 glOrtho 我可以设置坐标系，但我在使用 glPerspective 做同样的事情时遇
mysql - 子查询选择行作为列(透视)
SELECT j.departure, stopDepartures.* FROM journey j JOIN journey_day ON journey_day.journey = j.id J
MYSQL 透视/将行转换为值匹配的列
我确实需要一些帮助来了解如何根据相似的值对表格进行透视。 day | startDate ----------------------- Monday | 09:00 Monday |
python - 透视/旋转数据集的最佳方式
我有以下数据框 df = pd.DataFrame({ '1': ['Mon (07/08)','Sales', '2'], '2': ['Mon (07/0
python - 分组依据/透视
dummy_df = pd.DataFrame({ 'accnt' : [101, 102, 103, 104, 101, 102, 103, 104, 101, 102, 103, 104,
android - 3D旋转-透视
public class MainActivity extends Activity { LinearLayout rotator; protected void onCreate(Bundle sa
PHP ImageMagick Plane2Cylinder 透视
我正在尝试通过 PHP 更改 ImageMagick 中 Plane2Cylinder 失真的视角。为了帮助解释我在寻找什么，我制作了这张图: 您可以看到红色 block 的下部比顶部的半径更大，就
sql - 透视 - SQL - 来自子查询的值
我有一个像这样的简单查询.. USE AdventureWorks; GO SELECT DaysToManufacture, AVG(StandardCost) AS AverageCost FRO
mysql - 透视 MySQL 数据
我希望我可以更改架构，但我受制于它，假设我有以下表格 JanDataTable FebDataTable MarDataTable ProductsTable 其中前三个表有 ID 和 Amount
c# - 透视 3D 对象
我正在将我们的一个旧应用程序从 vb6 更新到 c#，在此过程中必须重新创建原始程序员设计的自定义控件。该控件简单地获取对象的尺寸，矩形或圆锥形，并在 3D 中放置对象的轮廓草图(我认为在技术上是 2
mysql - 透视 MySQL 表
我一直在尝试在 MySQL 中对表进行透视(将行移动到列)。我知道 mysql 没有枢纽功能，所以我认为需要联合，但不是 100% 确定。我有三列，user_id、option_id 和 Questi
mysql - 透视 mysql 表返回
我正在尝试旋转像这样创建的 mysql 表 'CREATE TABLE `fundreturns` ( `Timestamp` datetime NOT NULL, `FundName` varcha
mysql - 多连接查询，透视？烦恼
提前感谢任何对此提供帮助的人。我知道我以前做过这件事，没有太多痛苦，但似乎找不到解决方案我的数据库看起来像这样: `tbl_user: ---------- id ( pkey )
javascript - 透视 CSS3 不工作
我正在尝试开发 X 轴方向的卡片翻转动画。截至目前，div 现在只需使用 rotateX() 方法进行旋转。我试过对上层 div 使用透视属性，而不是工作它扭曲了我的 div 结构。因为，这只是一个工
CSS3 透视 z 轴可见性
我有一个带有 CSS3 透视图的 DIV 元素。 DIV 包含 2 个子 DIV，其中之一在 z 轴上有平移。这应该会导致一个 DIV 在另一个前面，因此后面的那个应该被挡住。然而，这些 DIV 的
CSS3 第二个 3D 透视
大家好，我有一张这样的 map http://sinanisler.com/demo/map/ 如您所见，有一些树，但不是真正的视角，我想要这个 http://sinanisler.com/demo/
c++ - OpenGL 平截头体、透视
我有以下代码将快照拍摄到帧缓冲区。我验证了帧缓冲区工作正常并且相机正确地面向对象。我曾经正确地完成图片，但它是基于错误的代码，使用了错误的截锥体。所以我决定重新开始(使用截锥体)。物体以中间为中心，
python - 透视 Pandas 数据并添加列
我正在尝试将求和列添加到透视数据框，但不断收到数据解析错误。 mydata = [{'amount': 3200, 'close_date':'2013-03-31', 'customer': 'Cu
c# - 透视 IEnumerable 列表
我正在尝试将一些 groupby/crosstabbing 逻辑应用于用户定义对象的 IEnumerable 列表，并且想知道是否有人可以帮助我。我坚持使用现有的(相当烦人的)对象模型来工作，但无论如
ios - CoreImage 的深度/透视？
我想使用一个 CALayer 创建如下图所示的效果 - 而不是通过拆分图像、对两半进行透视变换然后将它们并排放置。可以使用 CoreImage 以任何方式完成吗？或者，有人可以使用 OpenGL

首页

博学

6Ren·AI

商城