gpt4 book ai didi

python - Pandas - 在两列中查找具有匹配值的行并在另一列中乘以值

转载 作者:太空宇宙 更新时间:2023-11-03 14:43:07 25 4
gpt4 key购买 nike

首先假设我们有一个数据框如下:

import pandas as pd
data = pd.DataFrame({'id':['1','2','3','4','5','6','7','8'],
'A':['foo', 'bar', 'foo', 'bar','foo', 'bar', 'foo', 'foo'],
'C':['10','10','10','30','50','60','50','8'],
'D':['9','8','7','6','5','4','3','2']})
print(data)

A C D id
0 foo 10 9 1
1 bar 10 8 2
2 foo 10 7 3
3 bar 30 6 4
4 foo 50 5 5
5 bar 60 4 6
6 foo 50 3 7
7 foo 8 2 8

我想做的是找到匹配行,然后进行一些计算。

for any two ids(idx, idy) in data.iterrows():
if idx.A == idy.A and idx.C = idy.C:
result = idx.D * idy.D

然后生成一个包含三列的新数据框 ['id']['A']['result'] .

所以几行预期结果是:

     id   A   result   
0 1 foo 63
1 3 foo 63
2 5 foo 15
3 7 foo 15

我已经尝试过,但结果要么是错误的逻辑,要么是错误的代码/数据格式。有人可以帮我一下吗?

最佳答案

一种方法是按A + C分组,取产品并计数,过滤掉组中只有单个项目的那些,然后在A + C上内部合并回您的原始框架,例如:

df.merge(
df.groupby(['A', 'C']).D.agg(['prod', 'count'])
[lambda r: r['count'] > 1],
left_on=['A', 'C'],
right_index=True
)

给你:

     A   C  D  id  prod  count
0 foo 10 9 1 63 2
2 foo 10 7 3 63 2
4 foo 50 5 5 15 2
6 foo 50 3 7 15 2

然后根据需要删除/重命名列。

关于python - Pandas - 在两列中查找具有匹配值的行并在另一列中乘以值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51808294/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com