gpt4 book ai didi

java - 如何附加ORC文件

转载 作者:可可西里 更新时间:2023-11-01 14:19:20 26 4
gpt4 key购买 nike

我们有一个要求,我们需要在其中添加 ORC 文件。我试图谷歌它但没有结果。 ORCorg.apache.hadoop.hive.ql.io.orc.WriterImpl 也没有附加 API。无论如何要附加ORC文件吗? (更具体地使用JAVA)

最佳答案

ORC 数据文件分割为独立的 strip ;每个 strip 都在一个原子步骤中创建。参见 the official documentation了解详情。

我不相信您可以即时直接附加到现有文件。这意味着在写入时作业崩溃时留下损坏的 strip (因此是损坏的文件)。

但是你可以

  • 创建一个新的 ORC 数据文件(它将包含 1..N strip ,具体取决于实际数据量与 orc.stripe.size 属性)每个 reducer
  • 然后使用Hive V0.14 and above“连接”这些数据文件和现有文件。

关于java - 如何附加ORC文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32375277/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com