gpt4 book ai didi

hadoop - 如何在 Spark 中进行文本分析

转载 作者:可可西里 更新时间:2023-11-01 14:42:37 24 4
gpt4 key购买 nike

我对 Hadoop 非常熟悉,但对 Apache Spark 完全陌生。目前我正在使用 Mahout 中实现的 LDA(Latent Dirichlet Allocation)算法来进行主题发现。但是,由于我需要使过程更快,所以我想使用 spark,但是 Spark MLib 中未实现 LDA(或 CVB)算法。这是否意味着我必须自己从头开始实现?如果是这样,Spark 是否提供了一些使其更容易的工具?

最佳答案

LDA 最近才被添加到 Spark 中。它不是当前 1.2.1 版本的一部分。

然而,您可以在当前的 SNAPSHOT 版本中找到示例:LDAExample.scala

您还可以阅读有关 SPARK-1405 issue 的有趣信息.


那我该如何使用呢?

在未发布的情况下,最简单的方法可能是将以下类复制到您的项目中,就像您自己编写代码一样:

关于hadoop - 如何在 Spark 中进行文本分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28842340/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com