gpt4 book ai didi

Python - 如何确定数据点是随机的还是聚集的?

转载 作者:行者123 更新时间:2023-12-01 08:33:04 24 4
gpt4 key购买 nike

假设我们正在分析一个月内的预订模式。我将给出三个示例数据集。我正在寻找任何算法来根据随机性区分这些。

data-set 1                    data-set2
day bookings day bookings
1 20 3 35
2 11 15 40
3 8 22 11
5 31
6 19 data-set 3
7 7 10 20
9 15 11 37
11 22 12 9
12 23 13 26
13 12
14 10
15 20
16 13
19 22
20 18
21 19
22 4
23 2
24 31
25 23
27 28
28 9
29 13
30 27

肉眼观察这些数据集的day”值,可以明显看出data-set1是随机的,data-set2是分散的,data-set 3是聚集的

我的问题是是否有任何算法可以在 Python 中使用来为极大的数据集实现这些结果。

最佳答案

只需使用任何聚类算法即可。您只有一个自变量 ' bookings ',因此计算距离的计算成本不应该很高。您可以使用sklearn.cluster.KMeans ,例如。

如果您不想分析需要多少个簇,则可以使用不需要先验簇数的算法,例如 sklearn.cluster.DBSCAN .

关于Python - 如何确定数据点是随机的还是聚集的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53852214/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com