gpt4 book ai didi

python - 在特定列中隔离具有相同值的数据帧行的有效方法是什么?

转载 作者:行者123 更新时间:2023-12-04 08:33:36 24 4
gpt4 key购买 nike

我有一个如下所示的 Pandas DataFrame:

AA,    BB,    CC,    _id1,     _id2,     _id3
"foo", "foo", "foo", "1A1A1A", "1A1A1A", "1A1A1A"
"foo", "foo", "foo", "2B2B2B", "4L4L4L", "2B2B2B"
我想用 _id 隔离行不完全相同的值。在上面的例子中,它会隔离第二行,而忽略第一行。
不知多少 _id在任何给定的运行中,列都将存在(并需要检查),它们的名称会有所不同(但将作为字符串列表提供: id_column_names 。名称也将始终具有 _id 前缀。
是否有任何表格(或至少系列)操作在这里相当有效?
我当然可以写一些函数(迭代和相关的行值)和 apply()它是按行排列的,但有更好的选择吗?

最佳答案

第一个过滤器_id专栏作者 DataFrame.filter 然后通过 DataFrame.eq 测试是否相同的值第一列带有 DataFrame.all :

df1 = df.filter(regex='^_id')

df = df[~df1.eq(df1.iloc[:, 0], axis=0).all(axis=1)]
print (df)
AA BB CC _id1 _id2 _id3
1 foo foo foo 2B2B2B 4L4L4L 2B2B2B

关于python - 在特定列中隔离具有相同值的数据帧行的有效方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64909039/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com