gpt4 book ai didi

Java 对 PMML 的支持

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:25:56 24 4
gpt4 key购买 nike

我是 PMML 的新手:预测模型标记语言 (www.dmg.org),我想知道是否有某种 Java 支持(开源/专业)用于创建/解析 PMML 文件。

最初我只考虑从 Java 环境以编程方式创建/解析 PMML 文件的可能性。

我一直在“谷歌搜索”,发现了几种可能性:

开源:

来自 Java。

  • JDM . javax.数据挖掘。好像死了?有人有更多信息吗?

专业。

自己动手

  • 使用 XML Java 库并为自己构建 PMML 文件的解析器/编写器

我很欣赏你所有的意见。

提前致谢

奥斯卡

最佳答案

您应该意识到答案可能取决于您要使用的模型元素。您创建 PMML 和解析 PMML 的最佳选择也很可能来自不同的软件包。我将假设“创建 PMML”是指文档而不是模型。我从未听说过有人将自动模型拟合与执行相结合,但也许它已经存在了。当然可以使用 SOAP 传递 PMML 模型。

我无法谈论其他项目,但 Zementis 提供的产品名为 Adapa , 仅用于 PMML 的执行。本产品假设有一个模型拟合应用程序将通过将拟合模型导出到 PMML 中来进行创建。已经有很多开发良好的模型拟合应用程序,所以我认为这是一个合理的假设。

我使用的版本 (3.6) 通常速度很快,但如果没有特别大的堆,它无法处理典型随机森林大小(500 多棵树)的集合。我认为他们可能已经在较新的版本中修复了这个问题。虽然没有做广告,但 Zementis 似乎没有提供其中的一些模型,即文本模型、序列、基线模型或时间序列(无论如何,PMML 标准目前只有指数平滑)。我的版本也没有 K 最近邻,但我听说更新的版本有。

除非您正在考虑综合拟合和执行(在这种情况下您应该考虑在线学习),我的建议是按顺序考虑这些问题:

  1. 我有兴趣使用哪种模型类型?
  2. 我更喜欢在哪些应用程序中构建模型?
  3. 最后,我将如何执行此操作以及我在这方面有哪些要求(网络服务、云、性能等)?

如果您查看 members 的列表对于 DMG 组,您会发现许多商业供应商要么在供应方(例如 SAS、SPSS、Togaware、Rapid-I),要么在需求方(不胜枚举)。

在您的列表中,您也没有提到 Weka,而是 they also execute some PMML models还有R/Java based solutions所以你可以执行 PMML->R imports (see fileToXMLNode)在 Java 环境中(但您也可以只执行 R)。

最后,如果您心中有一个非常具体的模型,并且理解“执行它”在数学上意味着什么,那么自己构建您需要的模型应该不会太困难。

关于Java 对 PMML 的支持,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7280845/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com