gpt4 book ai didi

hadoop - HDFS 中的 Avro 架构生成

转载 作者:可可西里 更新时间:2023-11-01 16:42:03 25 4
gpt4 key购买 nike

我有一个场景,我在 HDFS 中有一些 avro 文件。我需要为 HDFS 中的那些 AVRO 数据文件生成 Avro 架构文件。我尝试使用 Spark ( https://github.com/databricks/spark-avro/blob/master/src/main/scala/com/databricks/spark/avro/SchemaConverters.scala) 进行研究。

除了把AVRO数据文件带到本地,做HDFS PUT还有没有其他的。

欢迎任何建议。谢谢!

最佳答案

每个 avro 文件都包含它编写时使用的 avro 模式。您可以使用 avro-tools.jar(从 maven 下载)提取此模式。你可以只下载一部分(假设所有其他文件都是用相同的模式编写的)并使用 avro 工具(java -jar ~/workspace/avro-tools-1.7.7.jar getschema xxx.avro)来提取它

关于hadoop - HDFS 中的 Avro 架构生成,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40047074/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com