gpt4 book ai didi

Oracle R Enterprise (ORE) KMeans 包

转载 作者:可可西里 更新时间:2023-11-01 15:18:44 30 4
gpt4 key购买 nike

我的任务是在 SAS 服务器上运行 K-Means 聚类算法,但内存不足。数据集是 500G,我知道我可以对其进行采样以适合内存,但如果我想在整个数据上运行模型,Oracle R Enterprise (ORE) 会帮助解决我的问题吗?

关于 ORE 和 ORCH 的其他相关问题:

  1. Oracle R 包是否包含任何聚类算法?是否有可用的 Oracle R 包列表?
  2. 如果我在 Oracle R Enterprise 中运行 kmeans 算法(R CRAN 包),我是否也会遇到内存问题?
  3. BDA 中是否有任何 R 集群包可用,可以在分布式 Hadoop 集群上运行?

谢谢

最佳答案

您最好的选择是在 Hadoop 上使用 Mahout。 Mahout 确实支持 K-Means 聚类,如所述 here在 Hadoop 上设置 Mahout 非常容易。

如果您可以使用几台机器构建自己的 Hadoop 集群,运行 Mahout 将需要 30 分钟左右。当我几天前尝试时 this blog极大地帮助了我。

您也可以这样做并节省大量金钱和时间。

我没有谈论使用 Oracle R,只是因为,首先我对 Oracle R 了解不多,但我知道 Hadoop 上的 Mahout 会比其他任何工具更好地帮助您,因为有很多有关如何在短时间内完成它的资源。如果你真的在寻找 Oracle R,这不是答案,否则它肯定是。

关于Oracle R Enterprise (ORE) KMeans 包,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10840862/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com