gpt4 book ai didi

java - 在没有 Spark 的 Scala 中使用 parquet-mr

转载 作者:行者123 更新时间:2023-11-30 07:20:01 24 4
gpt4 key购买 nike

我正在尝试在不使用 Spark 的情况下在 Scala 中读取 .parquet 文件。

我找到了this SO post ,但是到目前为止一直无法找到如何使用parquet-mr library实际从文件中读取(包括获取架构)。有像 RecordReader.java 和 RecordReaderImplementation.java (它扩展了 RecordReader)之类的东西,但我很难理解如何在我的 Scala 代码中使用它们。我对 Scala 和 Parquet 格式非常陌生,但希望在不使用 Spark 的情况下完成此任务。

我在这里缺少什么?

最佳答案

在找不到其他东西之后,我最终自己构建了一些东西。万一其他人将来遇到这个问题:https://github.com/jmd1011/parquet-readers

关于java - 在没有 Spark 的 Scala 中使用 parquet-mr,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37754062/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com