gpt4 book ai didi

python - 如何删除分隔符;并从列中删除重复值

转载 作者:行者123 更新时间:2023-12-01 00:58:34 25 4
gpt4 key购买 nike

CaseNumber  Value   Open            crs               
03820567 1 Yes 2375636
03820573 1 Yes 2367131
03820587 1 Yes 2374597
03820598 1 Yes 2367429
03820599 2 Yes 2367131; 2342755
03820619 1 Yes 2377137
03820627 1 Yes 2367429
03820632 1 Yes 2342755

This is my data here in crs column i have to get count of unique values

My output should be
crs
2375636
2367131
2374597
2367429
2342755
2377137
crs.count() = 6
I tried code firstly spliting the delimeter ; into next row with casenumber then i can get unique number count easily but somehow i stuck in it.

[![

] 1 ] 1这是我使用的代码,但我得到的结果如下 但我出来了

    CaseNumber  CRs
0 3820567 [2375636]
1 3820573 [2367131]
2 3820587 [2374597]
3 3820598 [2367429]
4 3820599 [2308266; 2342755]
5 3820619 [2377137]
6 3820627 [2321772

这是我使用的代码,但我得到的结果如下 但我出来了

最佳答案

如果您想要的是 csr 中唯一元素的计数,这里有一种方法。您可以从使用 str.split 开始,并从结果中获取列表。然后使用itertools.chain要展平列表,请将其转换为 set 并获取 len:

from itertools import chain
len(set(chain(*df.crs.str.split('; ').values.tolist())))
# 6

关于python - 如何删除分隔符;并从列中删除重复值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56022795/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com