gpt4 book ai didi

python - 在 Python 中使用给定的聚类中心聚类数据

转载 作者:太空宇宙 更新时间:2023-11-03 11:03:55 24 4
gpt4 key购买 nike

我有一个要聚类的一维数值数据集(但我的问题也适用于 n 维数值数据集),并且我已经知道聚类中心的值。所以我只想将每个数据点映射到其关联的聚类中心(距离数据点最近的那个)。

我可以编写一个临时函数,但我真的更喜欢使用经过优化以在 pandas.Series 或 numpy.arrays 上工作的 Python 科学库,如 Scipy,因为我的数据集非常大(数亿个数据点) .

我该怎么做?

谢谢!

最佳答案

您正在寻找 scipy vq function .

第一个参数是要聚类的数据,第二个是聚类坐标。返回值的第一个元素是每个簇的索引(标签),这就是你想要的:

>>> vq( array([0,5,5]), array([1,2,3]) )
(array([0, 2, 2]), array([ 1., 2., 2.]))

关于python - 在 Python 中使用给定的聚类中心聚类数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25305155/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com