gpt4 book ai didi

java - 我们如何自定义 Mahout 的 FileDataModel delimiterPattern?

转载 作者:太空宇宙 更新时间:2023-11-04 15:12:03 25 4
gpt4 key购买 nike

我是 Mahout 新手,我正在使用 FileDataModel,但我发现 delimiterPattern 无法被覆盖,这确实是连线的,我认为设计良好的框架应该考虑不同的使用案例。

private final Splitter delimiterPattern;

就我而言,我想将其更改为:

private final Splitter delimiterPattern = Splitter.onPattern("\\s+");

我对此有两个问题:

  1. 为什么 Mahout 不允许开发者覆盖其 delimiterPattern ?
  2. 我们如何更改它?

===更新===

没关系,我只是向 Mahout 提交了一个补丁( https://issues.apache.org/jira/browse/MAHOUT-1398 ),将在 0.9 版本中集成。

最佳答案

您可以执行一些预处理并替换给定的分隔符,并将其设为 CSV 文件或可与 mahout 的 FileDataModel 一起使用的文件。

关于java - 我们如何自定义 Mahout 的 FileDataModel delimiterPattern?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21217376/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com