gpt4 book ai didi

python - 将重复项拆分为单独的表 - Pandas

转载 作者:行者123 更新时间:2023-11-28 21:09:26 24 4
gpt4 key购买 nike

在 Pandas 中,我可以使用

基于单个列删除数据库中的重复行
data.drop_duplicates('foo')

命令。我想知道是否有办法在另一个表中捕获此数据以供独立审查。

最佳答案

您可以在 foo 列上调用 duplicated 方法,然后基于它对原始数据框进行子集化,如下所示:

data.loc[data['foo'].duplicated(), :]

举个例子:

data = pd.DataFrame({'foo': [1,1,1,2,2,2], 'bar': [1,1,2,2,3,3]})    
data

# bar foo
#0 1 1
#1 1 1
#2 2 1
#3 2 2
#4 3 2
#5 3 2


data.loc[data['foo'].duplicated(), :]
# bar foo
#1 1 1
#2 2 1
#4 3 2
#5 3 2

关于python - 将重复项拆分为单独的表 - Pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38319249/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com