gpt4 book ai didi

python - pandas 从单列中删除重复项,同时保持剩余行完整

转载 作者:行者123 更新时间:2023-11-30 22:20:07 25 4
gpt4 key购买 nike

我有一个如下所示的数据框。我想仅从一列中删除重复项,同时保持行的其余部分完好无损。

我想要的逻辑是 -

对于 Jan 列,从最后一行开始

对于最后一个单元格,如果倒数第二行中的值与当前值相同,则仅删除该单元格值(不删除行)。

然后继续直到到达第一行

sales = [{'account': '3', 'Jan': 'try', 'Feb': '200 .jones', 'URL': 'ea2018-001.pdf try bbbbb why try'},
{'account': '1', 'Jan': 'try', 'Feb': '210', 'URL': 'try '},
{'account': '2', 'Jan': 'bbbbb', 'Feb': '90', 'URL': 'ea2017-104.pdf bb cc for why' }]
df = pd.DataFrame(sales)
df

df
Out[105]:
Feb Jan URL account
0 200 .jones try ea2018-001.pdf try bbbbb why try 3
1 210 try try 1
2 90 bbbbb ea2017-104.pdf bb cc for why 2

我想要的输出如下

          Feb    Jan                               URL account
0 200 .jones try ea2018-001.pdf try bbbbb why try 3
1 210 try 1
2 90 bbbbb ea2017-104.pdf bb cc for why 2

最佳答案

首先,确定重复的连续值,然后使用 pd.Series.mask 隐藏它们。感谢 piR 的改进:

df.Jan.mask(df.Jan.eq(df.Jan.shift()), '')

0 try
1
2 bbbbb
Name: Jan, dtype: object

您可以将其分配回df.Jan

关于python - pandas 从单列中删除重复项,同时保持剩余行完整,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48917186/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com