gpt4 book ai didi

apache-spark - Apache Spark 和 Apache Apex 之间有什么区别?

转载 作者:行者123 更新时间:2023-11-30 08:22:14 25 4
gpt4 key购买 nike

Apache Apex - 是一个开源企业级统一流批处理平台。它用于GE Predix 物联网平台。这两个平台之间的主要区别是什么?

问题

  1. 从数据科学的角度来看,它与 Spark 有何不同?
  2. Apache Apex 是否提供 Spark MLlib 等功能?如果我们必须在 Apache apex 上构建可扩展的机器学习模型,该怎么做以及使用哪种语言?
  3. 数据科学家必须学习 Java 才能构建可扩展的机器学习模型吗?它有像 pyspark 这样的 python API 吗?
  4. Apache Apex 可以与 Spark 集成吗?我们可以在 Apex 之上使用 Spark MLlib 来构建机器学习模型吗?

最佳答案

  1. Apache Apex 是一个用于处理流数据的引擎。其他一些尝试实现相同目标的有 Apache Storm、Apache Flink。 Apache Apex 的与众不同之处在于:它内置了对容错性、可扩展性的支持,并且注重可操作性,这些都是生产用例中的关键考虑因素。

与Spark比较:Apache Spark实际上是批处理。如果您考虑 Spark 流(在底层使用 Spark),那么它就是微批处理。相比之下,Apache apex 是真正的流处理。从某种意义上说,传入记录不必等待下一条记录进行处理。记录一到达就被处理并发送到下一级处理。

  • 目前,添加对 Apache Apex 与 Apache Samoa、H2O 等机器学习库集成的支持的工作正在进行中请参阅https://issues.apache.org/jira/browse/SAMOA-49

  • 目前支持Java、Scala。
    https://www.datatorrent.com/blog/blog-writing-apache-apex-application-in-scala/对于 Python,您可以使用 Jython 尝试。但是,我自己还没有尝试过。所以,不太确定。

  • 考虑到 Spark 是两个不同的处理引擎,与 Spark 集成可能不是一个好主意。但是,Apache apex 与机器学习库的集成正在进行中。

  • 如果您有任何其他问题或功能请求,您可以将其发布到 apache apex 用户的邮件列表中:https://mail-archives.apache.org/mod_mbox/incubator-apex-users/

    关于apache-spark - Apache Spark 和 Apache Apex 之间有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35579783/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com