gpt4 book ai didi

python - 根据前 4 个字母从 Python 中的数组中删除重复项

转载 作者:行者123 更新时间:2023-11-28 21:05:05 25 4
gpt4 key购买 nike

我有一个邮政编码列表,例如

DD1 1DB
DD1 5PH
DD10 8JG
DD10 9LJ

我想做的是保留第一个代表,这取决于邮政编码的第一部分,例如

我需要保留:

DD1 1DB
DD10 8JG

我正在使用 pandas 并将包含 POSTCODES 列的 file.csv 导入为:

df = pandas.read_csv('file.csv')
pc = df.POSTCODES

现在我完全卡住了。我设法使用 Excel 让它工作(这是更好的选择吗?)但我想学习 python 并决定看看我是否可以在 python 中完成它。

最佳答案

你可以使用 df['POSTCODES'].str[:4]获得前四个字符,并使用 duplicated method识别重复项:

In [89]: df.loc[~df['POSTCODES'].str[:4].duplicated(keep='first')]
Out[89]:
POSTCODES
0 DD1 1DB
2 DD10 8JG

由于 duplicated(keep='first') 将重复项标记为 True,因此我们希望保留的行将标记为 False。所以用 df.loc 选择 False 行, ~ 用于 invert the boolean Series .

关于python - 根据前 4 个字母从 Python 中的数组中删除重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44530818/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com