gpt4 book ai didi

python - 如何从给定数据中找到python中的公共(public)数据对

转载 作者:太空宇宙 更新时间:2023-11-04 02:14:14 25 4
gpt4 key购买 nike

我有一个数据看起来像这样

Start Time         End Time       Trip Duration    Start Station   End Station 
01/01/17 15:09 01/01/17 15:14 321 A B
01/02/17 15:09 01/02/17 15:14 321 C D
12/03/17 15:09 12/03/17 15:14 321 E F
05/01/17 15:09 05/01/17 15:14 321 B D
17/02/17 15:09 17/02/17 15:14 321 A B
12/04/17 15:09 12/04/17 15:14 321 E H
13/05/17 15:09 13/05/17 15:14 321 S K
17/01/17 15:09 17/01/17 15:14 321 A B

使用下面的代码,我能够找到最常见的起始站

start_station = filtered['Start Station'].mode()[0]

我需要找到最常见的行程,即一对起点站和终点站相同的地方。根据以上数据,最常见的行程应该是b/w A和B

谁能告诉我如何找到共同的旅行

最佳答案

使用GroupBy.sizenlargestsort_valuesiloc用于选择最后一个值。

函数remove_unused_levels用于通过删除 Series 的值来删除 MultiIndex 值。

a = (df.groupby(['Start Station','End Station'])
.size()
.nlargest(1)
.index.remove_unused_levels()
.tolist()
)

或者:

a = (df.groupby(['Start Station','End Station'])
.size()
.sort_values()
.iloc[[-1]]
.index.remove_unused_levels()
.tolist()
)

print(a)
[('A', 'B')]

如果要输出DataFrame:

df1 = (df.groupby(['Start Station','End Station'])
.size()
.reset_index(name='count')
.nlargest(1, 'count')[['Start Station','End Station']]
)
print (df1)
Start Station End Station
0 A B

关于python - 如何从给定数据中找到python中的公共(public)数据对,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53003525/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com