gpt4 book ai didi

MongoDB 和 Apache Spark 投影

转载 作者:可可西里 更新时间:2023-11-01 09:51:28 26 4
gpt4 key购买 nike

将 MongoDB 集合拉入 Apache Spark/Hadoop 时,是否可以通过 MongoInputFormat 进行投影以减少返回数据集的大小?

最佳答案

是的,您可以在配置 MongoDB Hadoop 连接器时指定 mongo.input.fields 选项:

val config = new Configuration()
config.set("mongo.input.uri", [Your URI])
config.set("mongo.input.query", [Your Query])
config.set("mongo.input.fields", "{column: 1}")

引用the official MongoDB Documentations用于投影的语法。

关于MongoDB 和 Apache Spark 投影,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28762883/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com