gpt4 book ai didi

java - 具有Java类的Hive SequenceFile;只需传递给toString()

转载 作者:行者123 更新时间:2023-12-02 21:48:26 30 4
gpt4 key购买 nike

我有一个Hadoop SequenceFile,其中的键是IntWritable,值是实现Writable的任意Java类,并带有有趣的toString()方法。我想制作一个两列Hive表,其中第一列是作为int的键,第二列是作为字符串或varchar的值。

我希望以最有品味和最简单的方式做到这一点:我不必写200行代码就可以说“只是解码它,然后调用toString()”。

我当前的解决方案只是做一个额外的MapReduce工作,然后再将其以所需的格式放入Hive中,但是出于显而易见的原因,我发现这很令人反感。

谢谢!

最佳答案

您可以直接从Hive中读取序列文件。对于您来说,您需要实现org.apache.hadoop.hive.serde2.Deserializer
在解串器中,可以调用toString方法。不应超过30行代码。

关于java - 具有Java类的Hive SequenceFile;只需传递给toString(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23186353/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com