gpt4 book ai didi

python-3.x - 基于另一列合并 pandas 数据框中的间隔

转载 作者:行者123 更新时间:2023-12-02 18:38:35 25 4
gpt4 key购买 nike

我有一个 pandas 数据框,如下所示:

    ID     start   end     name
0 1 119 200 ss
1 1 118 156 ss
2. 1 110 200 ss
3 1 15 25 me
4 4 30 40 gg
5 4 30 55 gg

我想要做的是合并具有相同名称(名称列)且坐标(开始,结束)重叠的重叠间隔。因此生成的数据框将如下所示:

    ID     start   end     name
0 1 110 200 ss
1 1 15 25 me
2 4 30 55 gg

例如,对于名称列中的 ss,最低起始值为 110,最高最终值为 200。因此,新数据帧的起始值为 110,结束值为 200。我怎样才能实现这个目标?见解将不胜感激。

最佳答案

从这里开始

     ID  start  end name
0.0 1 119 200 ss
1.0 1 118 156 ss
2.0 1 110 200 ss
3.0 1 15 25 me
4.0 4 30 40 gg
5.0 4 30 55 gg

我们可以分组并聚合最小值和最大值。对于那些我们只想保持相同值的情况,我们可以使用 min 来获取第一个值。

df.groupby('name').agg({'ID': min, 'start': min, 'end': max, 'name': min})

结果

      ID  start  end name
name
gg 4 30 55 gg
me 1 15 25 me
ss 1 110 200 ss

关于python-3.x - 基于另一列合并 pandas 数据框中的间隔,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68390034/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com