gpt4 book ai didi

machine-learning - Mahout - JPA 集成。我需要 CSV 文件吗?

转载 作者:行者123 更新时间:2023-11-30 09:13:43 27 4
gpt4 key购买 nike

我有一个使用 openJPA 的现有数据模型,并且我正在尝试使用 Mahout 集成 CF 系统。

请原谅我,如果这是一个愚蠢的问题,但我刚刚开始研究象夫。 Mahout 的实际操作已通过邮件发送,因此我应该很快就能掌握最新情况。

我的问题是如何将 mahout 与现有的 jpa 模型集成。我是否需要向 DataModel 类提供 CSV 文件,或者我可以扩展 DataModel 以直接从现有数据源读取数据吗?我意识到从我的数据生成 CSV 文件不会很复杂,但这样做似乎是一个不必要的中间步骤。

我对“大数据集”世界非常陌生,所以请原谅我的无知。但是大多数使用 Mahout 的系统都使用 CSV 数据集吗?不知怎的,这对我来说似乎很奇怪。

谢谢。

编辑:

所以我正在阅读亚马逊提供的关于 Mahout in Action 的预览。似乎您可以将 mahout 接口(interface)直接连接到数据库中,但这样做是以性能为代价的。我迫不及待地想拿到这本书。任何有关此的评论或提示仍然非常感谢。

最佳答案

分布式/Hadoop 的内容将从 HDFS、Hbase 或 Cassandra 或您拥有的其他内容中读取。

非分布式的东西通常从文件中读取,并且有一些钩子(Hook)可以从数据库/JDBC 中读取。源并不那么重要,因为推荐模型无论如何都会将其加载到内存中。

您可以编写自己的DataSource、重用GenericDataModel或修改其他实现。

关于machine-learning - Mahout - JPA 集成。我需要 CSV 文件吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8916873/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com