gpt4 book ai didi

excel - 如何合并Excel工作表中的数据和Google云端硬盘中的文件?

转载 作者:行者123 更新时间:2023-12-02 20:29:37 24 4
gpt4 key购买 nike

我在Excel工作表中有学生的详细信息,并且在驱动器中有他们各自的文件。我应该如何使用Hadoop合并数据,以便分析和得出结果?

最佳答案

Excel不是数据库,因此在您的文件位于HDFS上(理想情况下是诸如Parquet之类的单独格式)或将其转换为正确的数据库之前,不能直接从Hadoop框架中查询它。

选项1)将Excel导出为CSV,然后上传到Hadoop并从那里继续

选项2)使用Apache POI(Java)或Pandas(Python)Excel库并与Hive自己集成,假设这就是您在这里所说的“Hadoop”。

选项3)Use Spark-Excel

请注意,除非您有超过100GB(较大的随机数)的学生数据,否则最好使用MySQL或Postgres

关于excel - 如何合并Excel工作表中的数据和Google云端硬盘中的文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54033880/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com