gpt4 book ai didi

apache-spark - 使用 Spark MLlib KMeans 从数据中预测集群

转载 作者:行者123 更新时间:2023-12-03 20:34:09 25 4
gpt4 key购买 nike

我已经根据我的数据特征生成了我的聚类中心,比如你在中找到的“Kmeans.data.txt”

https://github.com/apache/spark/blob/master/data/mllib/kmeans_data.txt

这是在 Spark MLib 中使用 KMeans 执行的。

clusters.clusterCenters.foreach(println)

知道如何预测从这些数据中得出的集群吗?

最佳答案

摘自从 Scala Spark 检索到的 KMean MLlib 聚类代码片段

import org.apache.spark.mllib.clustering.KMeans
import org.apache.spark.mllib.linalg.Vectors

// Load and parse the data
val data = sc.textFile("data/mllib/kmeans_data.txt")
val parsedData = data.map(s => Vectors.dense(s.split(' ').map(_.toDouble)))

// Cluster the data into two classes using KMeans
val numClusters = 2
val numIterations = 20
val clusters = KMeans.train(parsedData, numClusters, numIterations)

// here is what I added to predict data points that are within the clusters
clusters.predict(parsedData).foreach(println)

关于apache-spark - 使用 Spark MLlib KMeans 从数据中预测集群,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36145277/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com