Python pandas 迭代数据框-6ren

Python pandas 迭代数据框

转载作者：行者123 更新时间：2023-12-01 04:36:45

26

4

我正在尝试使用 Pandas，我需要解决以下问题。

我有一个数据集，其中的列如下所示:

X1 Y1 Z1 1.....(bunch of other columns)
X1 Y1 Z1 2.....(bunch of other columns)
X1 Y1 Z1 3.....(bunch of other columns)
X2 Y2 Z2 1.....(bunch of other columns)
X2 Y2 Z2 2.....(bunch of other columns)
X2 Y2 Z2 3.....(bunch of other columns)
X2 Y2 Z2 4.....(bunch of other columns)

我需要通过将前三列作为键来处理数据集。因此，我需要首先考虑与 X1 Y1 Z1 关联的所有行，处理其中的一堆列，然后继续处理下一个 block X2 Y2 Z2。所以首先是它的

X1 Y1 Z1 1.....(bunch of other columns)
X1 Y1 Z1 2.....(bunch of other columns)
X1 Y1 Z1 3.....(bunch of other columns)

后跟

X2 Y2 Z2 1.....(bunch of other columns)
X2 Y2 Z2 2.....(bunch of other columns)
X2 Y2 Z2 3.....(bunch of other columns)
X2 Y2 Z2 4.....(bunch of other columns)

我正在寻找 pandas 或 numpy 中的解决方案来处理此数据集。而且我处理数百万行，因此 pandas 的 iterrows() 会很慢。

最佳答案

如果您的数据加载到 DataFrame df 中，其中包含 X、Y、Z、col1, col2....，那么您可以循环数据的“组”/“ block ”，如下所示:

for concat_XYZ, df_group in df.groupby(df['X']+df['Y']+df['Z']):
    # process df_group
    # ....

每个df_group都是一个 block (或者本身就是一个DataFrame)，正如您在问题中所希望的那样。 X、Y 和 Z 列中字符串的串联用于唯一标识一个组。

关于Python pandas 迭代数据框，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31576198/

26

4

0

文章推荐： javascript - jQuery-steps:禁用点击提交

C++ bool 代数
我已经将一些变量声明为 bool 值，我希望 C++ 在我进行一些 bool 加法时知道该做什么，但它并没有按照我希望的方式发生。我如何让它工作。 #include using namespace s
mysql - 在SQL中模拟环(代数)
我正在创建小型配置文件查看器，我想在 SQL 中模拟环。怎么运行的？对于简单:我的 table 上有 5 个用户。当我从中间获得一个到我的实验(如用户编号 2、3、4)时，下一个和上一个用户是 CUR
filesystems - 什么是 inode 代数？
我计划使用低级 API 实现 FUSE 文件系统，目前正在尝试了解 fuse_entry_param结构体。不知道是什么unsigned long fuse_entry_param::generat
javascript - boolean 代数 - 如何化简
从事 JS 工作，刚刚开始学习 boolean 代数。想知道是否有办法简化这个表达式: (!variableOne || !variableTwo) 我记得听说过两个“not”意味着你可以改变符号，但
haskell - 授予可遍历的 F 代数，是否可能对应用代数进行变形？
我有这个 F-代数 (introduced in a previous question)，我想在它上面施放一个有效的代数。通过绝望的试验，我设法组合了一个有效的 monadic catamorphi
boolean-logic - bool 代数 - 证明德摩根定律
我在 Google 上到处寻找德摩根定律的 bool 代数(不是集合论)证明，但找不到。 Stack Overflow 也缺少 DeMorgan 定律问题。作为我的 CIS 251 类(class)
boolean-logic - bool 代数 : Prove that
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
javascript - bool 代数 - 使用 AND/OR 导出条件表达式是棘手的部分
正在解决这个问题。验证闰年的基本规则如下: - 大多数能被4整除的年份都是闰年。 - 异常(exception):世纪年不是闰年，除非它们可以被 400 整除。这就是答案: if(y%4==0 &
algorithm - 如何用多个变量简化 Big O 代数
假设算法的最坏情况运行时间可以描述为: T(n) = O(n) + O(r^2) + O(n-r) n 是输入大小，r 是根据算法创建分区的索引。这个等式可以进一步简化吗？如果变量都是 n 那么它将
javascript - JavaScript 中的 bool 代数
有没有办法在 JS 中使用 bool 代数？例如，我想遍历一个包含 true 和 false 的数组，并将其简化为只有 true 或 false。用 bool 代数来做这件事似乎是一种优雅的方式.
python - Pandas 中的 DataFrame 代数
假设我有两个数据框 df1 df2 我可以加入 df1_keys 和 df2_keys。我想做的事: (A-B) (A-B) U (B-A) A=df1 和 B=df2。根据我在 document
c - bool 代数 NOT 和 DWORD - 建议修复
这个问题已经有答案了: How can I remove a flag in C? (3 个回答) How to set, clear, and toggle a single bit? (27 个回
hadoop - 实现自定义 Apache pig 代数 UDF
大家我实现了自定义聚合 pig UDF。UDF 实现了 Algebraic 接口(interface)，并且有 3 个类 - Initial、Intermed 和 Final 在不同阶段进行工作。它
python - Pandas bool 代数 : True if True in both columns
我想制作一个 bool 向量，它是通过比较两个输入 bool 向量创建的。我可以使用 for 循环，但有更好的方法吗？我理想的解决方案是这样的: df['A'] = [True, False, Fa
java - 如何为 group by 编写 pig 代数 udf
我想编写一个 pig 代码来执行分组并生成 31 个字段的总和，但在此之前我需要做一些自定义处理，为此我编写了一个 eval 函数。我想如果我可以将 GROUP 和 SUM 操作包含到 UDF 中，我
boolean - 将 4 个与非门简化为 1 个异或门 boolean 代数？
我试图通过 boolean 代数来理解使用 4 个与非门如何等同于 1 个异或门。如果我们从维基百科看这张图片 http://en.wikipedia.org/wiki/XOR_gate#Alter

首页

博学

6Ren·AI

商城

Python pandas 迭代数据框