gpt4 book ai didi

python - 数据删除重复数据复杂

转载 作者:行者123 更新时间:2023-12-03 23:46:28 24 4
gpt4 key购买 nike

import pandas as pd

search = pd.DataFrame({
"Code": ["BB", "BB", "CC", "CC", "CC", "DD", "DD"],
"N1": [22, 20, 33, 30, 31, 44, 40]
})

confirmed = pd.DataFrame({'N2': [30, 40, 50]})

嗨,亲爱的,我在学习 Python/pandas 进行数据分析时有一个问题。我上面有两个数据框,我希望在确认的 df 中搜索数据值,如果该值匹配/出现在第一个 df(搜索)中,那么我们保留该值及其对应的“代码”并删除另一个相同的代码值(value)。例如,30在“confirmed”df中,它也出现在“search”数据框中,所以我们保留值30及其代码“CC”,同时删除其他“CC”和值(33, 31) .其他人也一样。

最后,“搜索”数据框应如下所示:
  Code  N1
0 BB 22
1 BB 20
2 CC 30
3 DD 40

作为一个 Python 数据菜鸟,这对我来说是一个相当复杂的问题,所以如果有人有任何想法,请帮忙。万分感谢。

最佳答案

transform之后 isin查看

s=search.N1.isin(confirmed.N2)
m=(~s).groupby(search['Code']).transform('all') | s
out=search[m]
out
Code N1
0 BB 22
1 BB 20
3 CC 30
6 DD 40

关于python - 数据删除重复数据复杂,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62460730/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com