gpt4 book ai didi

python - 比较数据框中的重复行以确定通过/失败

转载 作者:行者123 更新时间:2023-12-04 02:25:15 24 4
gpt4 key购买 nike

我有一个大型数据框,其中可能包含许多相似的数据点。删除重复项很容易,但我也想用不同的结果进行相同的测试,并将它们合并为一个通过/失败的结果。

示例数据

                                         
SW Group Name Result
0.1 Group1 Test1_30Hz Pass
0.1 Group1 Test1_30Hz Fail
0.1 Group1 Test2_60Hz Pass
0.1 Group1 Test3_120Hz Fail

即我会在 columns=[SW,Group,Name] 中查找具有匹配值的项目,然后在结果列中查找

示例输出

                                         
SW Group Name Result
0.1 Group1 Test1_30Hz Fail
0.1 Group1 Test2_60Hz Pass
0.1 Group1 Test3_120Hz Fail

我可以通过将数据结构更改为不是数据名并自己比较它们来轻松地做到这一点。但我正在努力学习如何更好地操作数据框本身内的数据,但它似乎总是比我想要的更难。

那么除了主要问题之外,对于学习什么才能更好地处理我的数据,是否有任何建议?

最佳答案

试试sort_values + drop_duplicates :

new_df = (
df.sort_values('Result')
.drop_duplicates(['SW', 'Group', 'Name'])
.sort_index()
)

new_df:

    SW   Group         Name Result
1 0.1 Group1 Test1_30Hz Fail
2 0.1 Group1 Test2_60Hz Pass
3 0.1 Group1 Test3_120Hz Fail

sort_values 确保 Fail 结果(如果存在)首先出现,因此当 drop_duplicates 删除所有条目时,但第一个会保留失败行。

关于python - 比较数据框中的重复行以确定通过/失败,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68274870/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com