gpt4 book ai didi

hadoop - Mahout:为什么我们将输入数据转换为序列文件?

转载 作者:行者123 更新时间:2023-12-02 21:39:48 25 4
gpt4 key购买 nike

我在mahout中看到了很多示例,这些示例要求将输入数据转换为序列文件。
这样做的目的是什么?。

最佳答案

如果要处理许多小文件,几乎是不可能的,并且浪费资源将它们原样放在HDFS中,那么一种更简单的选择是创建序列文件并以这种方式对其进行操作。看到这个:The Small Files Problem

关于hadoop - Mahout:为什么我们将输入数据转换为序列文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29580212/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com