gpt4 book ai didi

python - 如何使用 pandas 中其他列的 .size() 值创建新列?

转载 作者:行者123 更新时间:2023-12-01 07:00:37 25 4
gpt4 key购买 nike

 df2 = df_cleaned.groupby('company').size()
df2.columns = ['company', 'frequency']
#df2.sort_values('frequency') # error : No axis named frequency for object type <class 'type'>
df2

我有一个带有“公司”列的数据框“df_cleaned”,我尝试创建一个带有额外“频率”列的新数据框“df2”,以检查每家公司被提及的次数。我无法创建新的频率列。看来我做错了什么,请帮帮我。

Screenshot showing no frequency column

最佳答案

您没有为我们提供数据,因此请生成它:

import numpy as np
source = ['3Com', '3M', 'A-T-O', 'A.H. Robins']
cmp = [source[i] for i in np.random.randint(4, size = 20)]
df = pd.DataFrame(cmp, columns = ['company'])

Out[1]:
company
0 A.H. Robins
1 3M
2 A.H. Robins
3 A.H. Robins
4 3M
5 3M
6 3Com
7 A-T-O
8 3Com
9 A-T-O
10 3M
11 3M
12 A-T-O
13 3M
14 3M
15 A.H. Robins
16 A-T-O
17 A-T-O
18 A-T-O
19 3Com

df.groupby('company')[['company']].count().rename(columns = {'company':'frequency'})

Out[2]:

frequency
company
3Com 3
3M 7
A-T-O 6
A.H. Robins 4

关于python - 如何使用 pandas 中其他列的 .size() 值创建新列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58649997/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com