gpt4 book ai didi

python - 将数据框列中的相似行合并为一个

转载 作者:行者123 更新时间:2023-11-28 18:01:19 26 4
gpt4 key购买 nike

我正在处理芝加哥犯罪数据集,我创建了一个名为 primary 的数据框,它只是犯罪类型。然后我按犯罪类型分组并统计。这是相关代码。

primary = crimes2012[['Primary Type']].copy()
test=primary.groupby('PrimaryType').size().sort_values().reset_index(name='Count')

现在我有一个数据框“测试”,其中包含犯罪及其计数。我想做的是将某些罪行合并在一起。例如,“Non-Criminal”和“Non-Criminal”和“Non-Criminal(Subject Specified)”。但是因为它们现在是行,所以我不知道该怎么做。我试图使用 .loc[]

我也试过用

test['Primary Type'=='NON-CRIMINAL'] = test['Primary Type'=='NON - CRIMINAL']+test['Primary Type'=='NON-CRIMINAL']+test['Primary Type'=='NON-CRIMINAL (SUBJECT SPECIFIED)']

当然那只返回了一个 bool 值 false

最佳答案

您可以在这里查看 map 申请 - https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.map.html

您必须创建一个将您的输入映射到所需输出的字典desired_output = {"NON CRIMINAL": "NON-CRIMINAL", "NC": "NON-CRIMINAL", ...}

并将其应用/映射到您的 primary 系列,如下所示 -

primary = primary.map(desired_output)

然后像现在一样groupby

关于python - 将数据框列中的相似行合并为一个,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55553759/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com