gpt4 book ai didi

hadoop - 如何在MapReduce作业中输出数据以供Sqoop导出?

转载 作者:行者123 更新时间:2023-12-02 21:28:45 25 4
gpt4 key购买 nike

我已经阅读了很多有关使用Sqoop从SQL导入的信息,但是在导出时只有花哨的小窍门,这些示例始终假定您出于某种原因正在导出导入/预格式化的数据,或者正在使用Hive。

如何通过MapReduce作业将数据写入Sqoop可以读取和导出的HDFS?

This Sqoop documentation显示了支持的文件格式。我想我可以使用文本/ CSV,但是如何在MapReduce中到达那里?

I've found this answer,它表示只修改TextOutputFormat的选项,但只写键/值。我的“值”是多个字段/列!

最佳答案

尝试使用其他存储设备,例如avro或 Parquet (更多的 buggy ),因此您拥有一个架构。然后,您可以“查询”这些文件并将其数据导出到RDBMS。

但是,似乎该支持有点故障/损坏,并且仅当您使用Kite或sqoop(内部使用风筝)创建文件时才能正常工作。

http://grokbase.com/t/sqoop/user/1532zggqb7/how-does-sqoop-export-detect-avro-schema

关于hadoop - 如何在MapReduce作业中输出数据以供Sqoop导出?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35021523/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com