gpt4 book ai didi

apache-spark - 如何使用 Spark ORC 索引?

转载 作者:行者123 更新时间:2023-12-04 15:39:51 25 4
gpt4 key购买 nike

从 spark 启用 orc 索引的选项是什么?

          df
.write()
.option("mode", "DROPMALFORMED")
.option("compression", "snappy")
.mode("overwrite")
.format("orc")
.option("index", "user_id")
.save(...);

我在化妆 .option("index", uid) ,我必须在那里放置什么来索引来自 orc 的列“user_id”。

最佳答案

你有没有试过:.partitionBy("user_id") ?

 df
.write()
.option("mode", "DROPMALFORMED")
.option("compression", "snappy")
.mode("overwrite")
.format("orc")
.partitionBy("user_id")
.save(...)

关于apache-spark - 如何使用 Spark ORC 索引?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47005269/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com