gpt4 book ai didi

RCFIle 格式文件的 Hadoop NullWritable

转载 作者:可可西里 更新时间:2023-11-01 16:26:20 31 4
gpt4 key购买 nike

我不太理解Hadoop 中的NullWritable 的概念。它的用途是什么?为什么 RCFile 的 outputKeyClass 格式为 NullWritable.class 而 outputValueClass 为 BytesRefArrayWritable.class

最佳答案

这是因为 RCFiles 没有 key 。当您从 CSV 等纯文本文件中读取时, key 通常是文件中的字节偏移量。由于 RCFiles 具有列式存储格式,因此实际上并没有可用于标识行的键,因为行分散在不同的列集中。 NullWritable 本质上意味着忽略这个值

关于RCFIle 格式文件的 Hadoop NullWritable,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23395305/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com