gpt4 book ai didi

hadoop - 从HDFS导入表到Spark

转载 作者:行者123 更新时间:2023-12-02 21:46:51 25 4
gpt4 key购买 nike

有没有一种方法可以将表从HDFS直接导入到spark中并将其存储为RDD,还是需要将其制作为文本文件?

ps-我使用sqoop从本地系统将表放到HDFS上(如果那很重要),当我这样做时,它以4个文件的形式出现

最佳答案

虽然我没有在自己之前使用过sqoop,但是您可以使用它来创建配置单元表,然后可以使用Spark SQL查询它,这将带给您SchemaRDDs :)

关于hadoop - 从HDFS导入表到Spark,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24432937/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com