Python:如何将 Pandas Dataframe 行值转换为单独的列？-6ren

Python:如何将 Pandas Dataframe 行值转换为单独的列？

转载作者：行者123 更新时间：2023-12-05 08:48:10

我有以下数据框，其中包含不同时间间隔的不同作业开始和结束时间的数据。数据框的一小部分如下所示。

数据框(df):

result | job   |  time
START  | JOB0  |  1357  
START  | JOB2  |  2405
END    | JOB2  |  2379
START  | JOB3  |  4010
END    | JOB0  |  5209
END    | JOB3  |  6578
START  | JOB0  |  6000
END    | JOB0  |  6100

(注意 - 原始 Dataframe 有 5 个作业(JOB0 到 JOB4)我想将 result 列的值(START 和 END)转换为数据框中的单独列。

必需的数据框 (df2)

job  |  START  | END
JOB0 |  1357   | 5209
JOB2 |  2405   | 2379
JOB3 |  4010   | 6578
JOB0 |  6000   | 6100

代码
我尝试使用 pivot_table 实现它，但它给出了不需要的聚合值。

df2 = df.pivot_table('time', 'job','result')

代码输出

result |       END       |      START
job     
JOB0   |    5.000589e+08    5.000636e+08
JOB1   |    4.999141e+08    4.999188e+08
JOB2   |    5.001668e+08    5.001715e+08
JOB3   |    4.995190e+08    4.995187e+08
JOB4   |    5.003238e+08    5.003236e+08

我怎样才能获得所需的数据框？

最佳答案

您有重复的 job(JOB0 有 2 个不同的开始和结束时间)，因此您还需要根据累积计数 (groupby.cumcount) 进行调整，因此索引是独特的。之后您可以通过降低累积计数级别来整理数据透视表。

df['idx'] = df.groupby(['job', 'result']).cumcount()

(df.pivot(index=['job', 'idx'], columns='result', values='time')
  .sort_index(level=1)
  .droplevel(1)
  .reset_index()
  .rename_axis(None, axis=1)[['job', 'START', 'END']])

[输出]

    job  START   END
0  JOB0   1357  5209
1  JOB2   2405  2379
2  JOB3   4010  6578
3  JOB0   6000  6100

关于Python:如何将 Pandas Dataframe 行值转换为单独的列？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/66347877/

文章推荐： database - Mongo错误QueryExceededMemoryLimitNoDiskUseAllowed

文章推荐： reactjs - 如何防止 Nivo 刻度轴文本(条形图)中的文本截断

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

Python:如何将 Pandas Dataframe 行值转换为单独的列？