python - Pandas 数据框 : aggregate values within blocks of repeating IDs-6ren

python - Pandas 数据框 : aggregate values within blocks of repeating IDs

转载作者：行者123 更新时间：2023-12-05 02:53:34

25

4

给定一个包含 ID 列和相应值列的 DataFrame，我如何聚合(比方说求和)重复 ID block 中的值？

示例 DF:

import numpy as np
import pandas as pd

df = pd.DataFrame(
    {'id': ['a', 'a', 'a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'b', 'a', 'b', 'b', 'b'],
     'v': np.ones(15)}
    )

请注意，只有两个唯一 ID，因此简单的 groupby('id') 将不起作用。此外，ID 不会定期交替/重复。我想到的是重新创建索引，以表示已更改 ID 的 block :

# where id changes:
m = [True] + list(df['id'].values[:-1] != df['id'].values[1:])

# generate a new index from m:
idx, i = [], -1
for b in m:
    if b:
        i += 1
    idx.append(i)

# set as index:
df = df.set_index(np.array(idx))

# now I can use groupby:
df.groupby(df.index)['v'].sum()
# 0    5.0
# 1    3.0
# 2    2.0
# 3    1.0
# 4    1.0
# 5    3.0

这种重新创建索引的感觉有点不是您在 pandas 中执行此操作的方式。我错过了什么？有更好的方法吗？

最佳答案

这里有必要创建助手 Series，将不等于 ne 的移位值与累积和进行比较，并传递给 groupby，对于 id 列可以在列表中一起传递，首先通过 reset_index(level=0, drop=True) 删除 MultiIndex 的第一级，然后将索引转换为列 id:

print (df['id'].ne(df['id'].shift()).cumsum())
0     1
1     1
2     1
3     1
4     1
5     2
6     2
7     2
8     3
9     3
10    4
11    5
12    6
13    6
14    6
Name: id, dtype: int32

df1 = (df.groupby([df['id'].ne(df['id'].shift()).cumsum(), 'id'])['v'].sum()
          .reset_index(level=0, drop=True)
          .reset_index())
print (df1)
  id    v
0  a  5.0
1  b  3.0
2  a  2.0
3  b  1.0
4  a  1.0
5  b  3.0

另一个想法是使用 GroupBy.agg用字典和聚合 id 列 GroupBy.first :

df1 = (df.groupby(df['id'].ne(df['id'].shift()).cumsum(), as_index=False)
         .agg({'id':'first', 'v':'sum'}))

关于python - Pandas 数据框 : aggregate values within blocks of repeating IDs，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62167354/

25

4

0

文章推荐： reactjs - react 导航 : best way to implement logout navigation?

文章推荐： deno - 如何完全卸载 Deno 及其缓存包

文章推荐： flutter - 结合命名路由和 PageView

文章推荐： ruby-on-rails - ActiveSupport::Concern 应该包含或扩展

javascript - 带有影响内部 ng-repeat 逻辑的外部 ng-repeat 项的嵌套 ng-repeat
我的代码 "> 我想做的是如果外层 ng-repeat 中的 n 为 0，则 div.book_container 将如下所示: 否则，di
angularjs:ng-repeat-start 和 ng-repeat-end 带有内部 ng-repeat
嗨，我有一个用于 ng-repeat-start 和 end 的简单用例，并且工作正常，当我想添加内部 ng-repeat 时出现问题。这是我的代码 {{e}} {{obj.descr
Python 正则表达式 : How to repeat a repeat of a pattern?
我正在查看一长串 DNA 核苷酸，并正在寻找以起始代码“AAA”开头并以终止代码“CCC”结尾的序列。由于核苷酸以三联体形式出现，因此我找到的每个序列开始和结束之间的核苷酸数必须是三的倍数。例如，'
jsf - 用户界面 :repeat inside ui:repeat
我有这个: .... #{item.product.codigoProduto} #{m.description} ... listRequ
javascript - "Duplicates in a repeater are not allowed"on ng-repeat
我从服务请求中返回了以下 json 数据: { "entries": [{ "id": 2081, "name": "BM", "niceNam
Aurelia 嵌套 Repeat.for 父 Repeat.for 上下文
在 Aurelia 中嵌套 repeat.for 时，内部 repeat.for 无权访问其父 repeat.for 中使用的变量>. 示例 ${x} - ${y} 在上面的示
javascript - ng-repeat in Repeat 不重复嵌套对象 Angular
我有一个带有类别的对象，在这个对象内部有一个名为 items 的对象，其中包含带有 items 的对象。现在我想重复显示这样的项目: {{cat
javascript - CSS 背景重复 : no-repeat; still repeating
我有... html, body { background-size: contain; background-repeat: no-repeat; } 作为我的 CS
安卓 : Repeating background stops repeating on rotation
我的问题如下:旋转时，由重复图案组成的背景发生变化，因此图案被拉伸(stretch)而不是重复。可能有什么问题？我有这个由重复图案组成的背景: 最佳答案您必须手动设置重复模式: parent =
java - 如何设置background-repeat : no-repeat in element.风格
关于下面的元素如何编辑 element.style？我想要 background-repeat : no-repeat; 不确定从哪里设置它。 element { display: blo
java - RxJava2 : Repeat conditonally/don't repeat in `repeatWhen`
我有一个 Observable，我想定期重复，但仅限于以下条件: apiInterface.getData() // returns Observable ... // processing is h
html - 即使使用 'background-repeat: no-repeat' 也会重复背景图像
我无法停止 td 元素中的图像重复。它看起来很难看。我该如何解决这个问题？我也添加了 background-repeat: no-repeat 代码，但它仍然无法正常工作。请不要建议从我的 td 宽度
css - 哪个更快 : repeating styles or repeating selectors?
我想知道以下哪个示例的效果更好。如果性能相同，哪个读起来更好？示例 1(重复选择器) .helpfulCommenter, .questionTroll { 颜色:#f00； } .question
angularjs-ng-repeat - 引导工具提示不使用角度 ng-repeat 呈现
我正在尝试创建 tooltip对于通过 ng-repeat. 创建的表的第一行但是工具提示没有呈现。 HTML $(document).ready(function () {
javascript - 在另一个 ng-repeat 中使用 ng-repeat
我正在开发一个页面，我需要在其中显示一些框(使用 ng-repeat )，其中包含 channel 信息以及显示位置(城市)。我面临的问题是当我重复第二个 ng-repeat : 这应该获得第一个
javascript - ng-repeat 位于另一个 ng-repeat 内导致分页问题
我在另一个 ng-repeat 中有 ng-repeat，并且两者都有分页数据。主要的工作正常，但 ng-repeat 内的分页数据并不总是工作。它会抛出控制台错误。错误:[$interpolat
javascript - 为所有 ng-repeat 分开 ng-repeat..？
所以我有这个小问题。我对所有项目使用 ng-repeat，我们称它们为国家，每个项目本身都有一个 ng-repeat 作为城市等子类别。我用国家/地区填充下拉菜单。所以我有这样的国家列表: 美国德
javascript - ng-repeat 内 ng-repeat Angular
我有一条从 Angular $resource promise 返回的记录，如下所示。记录是一个数组，每个记录数组中都有另一个变量数组。我尝试在我的 View 中显示如下。 div(ng-repe
angularjs - 如何执行不重复 ng-repeat 元素的 ng-repeat
我需要使用 ng-repeat 来生成多个元素，但这些元素不能分别包装在 div 内(这是用于框布局的目的，其中框布局仅适用于直接子元素)。例如，我需要这个结果: Head 1 Body 1
带有参数 : @repeat(n) 的 Python3 'repeat' 装饰器
我已经看到(很多)许多教程和装饰器的片段 w/和 w/o 参数，包括我认为是规范答案的两个:Decorators with arguments , python decorator arguments

首页

博学

6Ren·AI

商城

python - Pandas 数据框 : aggregate values within blocks of repeating IDs