python - Pandas 发现两列之间的累积差异-6ren

python - Pandas 发现两列之间的累积差异

转载作者：行者123 更新时间：2023-12-04 13:08:20

26

4

我是 python 的新手，正在努力解决这个问题。我想编写一个程序，允许我针对 'a' 中的每个值，找到 'b' 中高于它的所有值的累积差，并将其写入新列 'c'。我有一个像这样的 Pandas 数据框:

import pandas as pd
df = pd.DataFrame({'a': [10, 15, 25, 30, 10, 20], 'b': [ 10, 'na', 20, 'na', 30, 10]})
        
Index|   a  |  b  |
0    |  10  | 10  |
1    |  15  | na  |
2    |  25  | 20  |
3    |  30  | na  |
4    |  10  | 30  |
5    |  20  | 10  |

我想跳过nas。 b 中的项目是大于零的值，因此如果它更容易，我可以将 nas 更改为 0 并仍然跳过所有 0 值。

理想情况下，我希望有一个像这样的新列 df['c']:

Index|   a  |  b  |  c  |
0    |  10  | 10  |  0  |  # 10-10 = 0
1    |  15  | na  |  5  |  # 15 - 10 = 5
2    |  25  | 20  | 20  |  # (25-20) + (25-10) = 5 + 15 = 20
3    |  30  | na  | 30  |  # (30-20) + (30-10) = 10+20 = 30
4    |  10  | 30  |-30  |  # (10-30) + (10-20) + (10-10) = -30
5    |  20  | 10  | 10  |  # (20-10) + (20-30) + (20-20) + (20-10) = 10

我试过使用 df['c] = cumsum(df['a'] - df['b']) ，但它没有完成工作——我需要从 df['b'] 中的相应值中减去 df['a']，以及 df['b' 列中它上面的所有值].

我也尝试过 df['c] = df['a'] * len(df['b'].unique()) - cumsum(df['b']) ，但是这个问题是 len(df['b'].unique()) 总是相同的长度(不根据索引改变)，而 b 中的数字是'不一定是唯一的(例如，10 出现在索引 0 和 5 处)。

谁能指出我正确的方向？

这也是我第一次使用 Stack Overflow；如果对我的格式或问题有任何不清楚的地方，请告诉我。谢谢!

最佳答案

你非常接近!您在第二种方法中适本地重构了数学，但是棘手的部分是如何通过此代码段 len(df['b'].unique()) 正确解释 NaN >。您可以创建一个掩码，其中 NaN 值 = 0 且非 NaN 值 = 1，然后对这些值求和以获得正确的乘法系数:

df["c"] = (df["a"] * df["b"].notnull().cumsum()) - df["b"].fillna(0).cumsum()

print(df)
    a     b     c
0  10  10.0   0.0
1  15   NaN   5.0
2  25  20.0  20.0
3  30   NaN  30.0
4  10  30.0 -30.0
5  20  10.0  10.0

为了消除分解系数的方法的模糊性，这里是一个中间输出:

>>> df["b"].notnull().cumsum()
0    1
1    1
2    2
3    2
4    3
5    4
Name: b, dtype: int64

关于python - Pandas 发现两列之间的累积差异，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/68309675/

26

4

0

文章推荐： apache - 为多个参数和页面编辑 .htaccess

文章推荐： python - 如何从 LineString 未排序列表创建多边形

文章推荐： java - 在 JSP 中使用复选框时出现索引顺序问题

蓝牙 UUID 发现
有谁知道蓝牙设备如何获取范围内可发现设备的设备 ID？理想情况下，我正在寻找涉及蓝牙协议(protocol)最小实现的最简单解决方案。一个起点会很好，我只是想创建一个设备，它可以以最小的功耗存储附
rest - 如何通过REST请求更改更改Kibana保存的搜索(发现)？
我有用于搜索Kibana中特定事件的查询，该查询与其他搜索一起保存，是否可以通过REST调用以编程方式更改它？最佳答案正如@Mohammad所说，所有与Kibana相关的元数据都存储在elasti
java - 发现@BootstrapWith的多个声明
我正在使用带有这些注释的基本集成测试: @ExtendWith(SpringExtension::class) @SpringBootTest(classes = [SomeApplication::
jQuery 发现 "selector"
以下是我的代码 HTML: Hello !! Javascript: $(function() { $('#content .child').click(function() {
Rust 发现，配置文件未按预期工作
我试图避免在每个 GDB session 中输入相同的命令。为此，我遵循了 rust discovery book 中的说明。但是当我通过 cargo run 运行程序时，程序没有像书中提到的那样工作
django项目根目录 self 发现
好的，我记得有一些命令可以放在 settings.py 文件中，这样基本上当您将 django 项目移动到另一个目录时，它就不会启动 foo-bar . 我知道我可以通过在它提到主目录的任何地方设置一
javascript - 发现 if 语句中的特定参数不正确？
假设我正在制作一份注册表单。现在我希望它突出显示四个字段中的空白字段。现在我可以只执行一堆 if-else 语句，但这将花费很长时间。假设我有以下代码: Javascript: if($firstn
发现 C++ 正则表达式子字符串错误模式
我试图理解 C++ 中 regex 的逻辑 std::string s ("Ni Ni Ni NI"); std::regex e ("(Ni)"); std::smatch sm; std::re
vim - 发现 Vim 退出状态的原因
运行时: vim /tmp/blah :q echo $? 我的退出状态为 1 .这破坏了包括 Git 在内的各种东西。如果我在没有 vimrc 的情况下运行 vim: vim -u NONE /tm
BASH 发现 ctime 没有按预期工作
我无法通过“查找”来查找旧文件。我将我的发现链接到一个声明中，所有其他部分都运行良好。这是我所拥有的精简版。它搜索 $path 的目录树，并为找到的每个项目创建仅包含换行符的单独临时文件:所有文件、超
c# - 发现 DotNet 无效证书
我已经多次看到这个问题，但没有一个答案对我有用。我的 DotNet Core 应用程序失败编码: public static void Main(string[] args) {
perl - 发现 Perl 内存泄漏
已解决见编辑 2 你好，我一直在编写一个 Perl 程序来处理本地(专有)程序的自动升级(对于我工作的公司)。基本上，它通过 cron 运行，不幸的是有内存泄漏(或类似的东西)。问题是泄漏只发生在
oracle - 发现 Oracle 数据库上的表返回空列表
在 icCube 中创建到 Oracle 数据库的连接时，“选择现有数据库表”返回一个空的表列表。连接很好，我可以查询模式创建 SQL 查询。最佳答案用户用作模式名称，但 Oracle 使用大写
excel - . 发现 VBA 需要很长时间才能跨两个工作表执行
我正在使用 VBA 循环遍历两个工作表上的行，如果它们匹配，则将工作表 2 中的行复制到工作表 1 中。我的代码应该: 打开第二个工作簿将所有信息复制到新工作表上的原始工作簿中然后循环遍历原始工
javascript - 发现 Sequelize 循环依赖
当我尝试同步我的数据库时出现这个奇怪的错误: Unhandled rejection Error: Cyclic dependency found. roles is dependent of its
perl - 发现 Perl 模块所有子例程的最佳方法是什么？
以编程方式发现 perl 模块具有的所有子例程的最佳方法是什么？这可以是一个模块、一个类(没有@EXPORT)或任何介于两者之间的东西。编辑:下面的所有方法看起来都可以工作。我可能会在生产中使用 C
javascript - 发现 meteor 显微镜分享按钮
如何在“讨论”按钮左侧添加“共享”按钮。我希望该按钮与当前的“讨论”按钮具有相同的样式/颜色。我从https://atmospherejs.com/joshowens/shareit添加了包我将
Eclipse 发现 netbeans 没有的语法错误
我最近从 Netbeans 切换到 Eclipse，Eclipse 在我的项目中发现了许多 Netbeans 没有的语法错误，我不知道为什么。据可以看出，两个 IDE 都设置为使用 java 1.6。
javascript - 发现 URL 验证的正确正则表达式存在困难
我必须为我的项目设置一些不接受错误网址的规则。我为此使用正则表达式。我的网址是“http://some/resource/location”。此网址的开头、中间或结尾不应留有空格。例如，这些空格
python - 发现 Azure 虚拟机规模集中的对等实例
问题:鉴于作为 VMSS 的一部分启动的 N 个实例，我希望每个 Azure 实例上的应用程序代码能够发现其他对等实例的 IP 地址。我该怎么做？总体目的是对实例进行集群，以提供主动被动 HA 或保

首页

博学

6Ren·AI

商城

python - Pandas 发现两列之间的累积差异