gpt4 book ai didi

pandas - 计算列表中的每个项目在以逗号分隔的值的pandas数据框列中出现的次数

转载 作者:行者123 更新时间:2023-12-03 16:10:18 25 4
gpt4 key购买 nike

我有一个 list :

citylist = ['New York', 'San Francisco', 'Los Angeles', 'Chicago', 'Miami']
以及具有这些值的pandas Dataframe df1
first   last            city                                email
John Travis New York a@email.com
Jim Perterson San Franciso, Los Angeles b@email.com
Nancy Travis Chicago b1@email.com
Jake Templeton Los Angeles b3@email.com
John Myers New York b4@email.com
Peter Johnson San Franciso, Chicago b5@email.com
Aby Peters Los Angeles b6@email.com
Amy Thomas San Franciso b7@email.com
Jessica Thompson Los Angeles, Chicago, New York b8@email.com
我想计算数据列表列“city”中来自citylist的每个城市发生的次数:
New York        3       
San Francisco 3
Los Angeles 4
Chicago 3
Miami 0
目前我有
dftest = df1.groupby(by='city', as_index=False).agg({'id': pd.Series.nunique})
并以“唯一值”计算“洛杉矶,芝加哥,纽约”
如上所示,有什么方法可以计数吗?
谢谢

最佳答案

试试这个:
首先修复数据:

df1['city'] = df1['city'].str.replace('Franciso', 'Francisco')
用这个:
(df1['city'].str.split(', ')
.explode()
.value_counts(sort=False)
.reindex(citylist, fill_value=0))
输出:
New York         3
San Francisco 3
Los Angeles 4
Chicago 3
Miami 0
Name: city, dtype: int64

关于pandas - 计算列表中的每个项目在以逗号分隔的值的pandas数据框列中出现的次数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64079437/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com