gpt4 book ai didi

python - Python 中的 K 均值实现

转载 作者:行者123 更新时间:2023-11-30 09:54:12 25 4
gpt4 key购买 nike

在 Python 中实现我自己的 K-means 算法更好,还是在 Python 库(例如 Scikit-Learn)中使用预先实现的 K-means 算法更好?

最佳答案

在回答哪个更好之前,先快速提醒一下该算法:

  1. “选择”簇数K
  2. 启动您的第一个质心
  3. 对于每个点,找到最近的质心根据距离函数 D
  4. 当所有点都归属于一个簇时,计算该簇的重心,作为其新的质心
  5. 重复第 3 步和第 4 步,直到收敛

正如之前所强调的,该算法取决于各种参数:

  • 聚类数量
  • 您的初始质心位置
  • 计算任意点与质心之间距离的距离函数
  • 计算每个新簇重心的函数
  • 收敛指标
  • ...

如果您对以上内容都不熟悉,并且您想了解每个参数的作用,我建议您在低维数据集上重新实现它。此外,实现的 Python 库可能不符合您的特定要求 - 尽管它们提供了良好的调整可能性。

如果您的目的是快速使用它并了解全局,您可以使用现有的实现 - scikit-learn 将是一个不错的选择。

关于python - Python 中的 K 均值实现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37751430/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com