gpt4 book ai didi

java - 象夫 : To read a custom input file

转载 作者:可可西里 更新时间:2023-11-01 14:16:35 24 4
gpt4 key购买 nike

我在玩 Mahout,发现 FileDataModel 接受以下格式的数据

     userId,itemId,pref(long,long,Double).

我有一些格式的数据

     String,long,double 

在 Mahout 上使用此数据集的最佳/最简单方法是什么?

最佳答案

一种方法是创建 FileDataModel 的扩展.您需要覆盖 readUserIDFromString(String value)使用某种解析器进行转换的方法。您可以使用 IDMigrator 的实现之一。 ,正如肖恩建议的那样。

例如,假设您有一个已初始化的 MemoryIDMigrator ,你可以这样做:

@Override
protected long readUserIDFromString(String stringID) {
long result = memoryIDMigrator.toLongID(stringID);
memoryIDMigrator.storeMapping(result, stringID);
return result;
}

这样您也可以使用 memoryIDMigrator 进行反向映射。如果您不需要它,您可以按照其在实现中的方式对其进行哈希处理(在 AbstractIDMigrator 中)。

关于java - 象夫 : To read a custom input file,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7209624/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com