python - 在 Pandas 中以矢量化方式计算特定连续相等值的数量-6ren

python - 在 Pandas 中以矢量化方式计算特定连续相等值的数量

转载作者：太空狗更新时间：2023-10-29 18:04:33

24

4

假设我们有以下 pandas DataFrame:

In [1]:
import pandas as pd
import numpy as np

df = pd.DataFrame([0, 1, 0, 0, 1, 1, 0, 1, 1, 1], columns=['in'])
df
Out[1]: 
   in
0   0
1   1
2   0
3   0
4   1
5   1
6   0
7   1
8   1
9   1

如何在 pandas 中以向量化的方式计算连续的个数？我想要这样的结果:

类似于在特定条件下重置的矢量化 cumsum 操作。

最佳答案

您可以这样做(致谢:how to emulate itertools.groupby with a series/dataframe?):

>>> df['in'].groupby((df['in'] != df['in'].shift()).cumsum()).cumsum()
0    0
1    1
2    0
3    0
4    1
5    2
6    0
7    1
8    2
9    3
dtype: int64

关于python - 在 Pandas 中以矢量化方式计算特定连续相等值的数量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29142487/

24

4

0

文章推荐： python - 从 Flask-Mail 发送邮件(SMTPSenderRefused 530)

文章推荐： c# - 在任务中返回 true 或 false 的异步方法

文章推荐： angular - 在 Angular TestBed 中模拟 Firestore 集合

文章推荐： c# - 异步和等待 - 如何维护执行顺序？

python - Pandas 'count(distinct)' 等值
我使用 Pandas 作为数据库替代品，因为我有多个数据库( Oracle 、 SQL Server 等)，并且我无法将一系列命令与 SQL 等效。我在 DataFrame 中加载了一个包含一些列的
haskell - Dimension-tf : creating ordinary Int, Double 等值？
使用 dimensional-tf 时包，是否可以使用“普通”Num 实例(即 Int、Double、Integer)，而无需使用一个单元？例如，此代码不进行类型检查(在 ghci 中): {-#
postgresql - 是否可以在 Postgres INSERT 中声明和使用 $1、$2 等值？
我有很多这样的陈述: INSERT INTO app.organization (name, org_type) VALUES ($1, $2) 在我的代码中。我想捕获它，将其粘贴到
postgresql - 是否可以在 Postgres INSERT 中声明和使用 $1、$2 等值？
我有很多这样的陈述: INSERT INTO app.organization (name, org_type) VALUES ($1, $2) 在我的代码中。我想捕获它，将其粘贴到
android - 使用 XML 的特定于平板电脑的 ImageView 宽度/高度/等值？
我正在使我的应用与平板电脑兼容，并且我正在尝试了解实现此目的的最佳方式。我有一个 GridView，每个图像下面都有图像和文本。目前每张图片的高度都设置为 120dp 而不是 wrap_conten
python - 使用 pymongo 在 MongoDB 中选择 * limit 100 等值
我对 MongoDB 非常陌生，并且使用 jupyter 笔记本从 mongodb 中提取数据。我正在尝试获取 MongoDB 中的前 100 个文档，并且我确实有一种仅获取 100 个文档的粗略方法
python - 如何在 flask-SQLAlchemy 中使用 Default 和 Onupdate 等值
我的代码， class User(db.Model, UserMixin): uid = db.Column(db.Integer, primary_key=True) username =
postgresql - 在 MAC OS X 10.6 上为 PostgreSQL 设置 SHMMAX 等值
我正在尝试在我的本地机器上启动我的 PostgreSQL 服务器。但是我收到一条错误消息: FATAL: could not create shared memory segment: Invali
c++ - 使用两个 vector ，一个带有 x、y、z 等变量，一个带有 1、2、3 等值，来构建像 x=1、y=2、z=3 这样的等式？
我正在使用基于 C++ 的程序，但它有自己的语法。例如，这是我将变量 x 设置为等于 2 的方式: x() = 2; 我从外部文件中读入变量及其初始值。数据存储在两个 vector 中。 vector

首页

博学

6Ren·AI

商城

python - 在 Pandas 中以矢量化方式计算特定连续相等值的数量