gpt4 book ai didi

Python - 为 csv/xls 文件生成 avro 模式

转载 作者:行者123 更新时间:2023-12-05 02:10:40 25 4
gpt4 key购买 nike

我有一个 XLS/CSV 文件,我正在将其读入 pandas 数据框。我想从这个数据帧中生成一个 avro 模式。

我是 python 和 pandas 的新手。请帮忙。

data_frame = pd.read_excel(INPUT_PATH)

我想从这个数据帧中动态生成一个 avro 模式。请帮忙

最佳答案

我找到了解决方法。我提取了 pandas 数据框中字段的数据类型,并将其保存在字段名称中。

将数据类型映射到 avro 兼容的数据类型(pandas 中的“对象”-> avro 中的“字符串”)

创建了一个 avro 模式的模板,并将替换的字段名称和数据类型放入“字段:[]”部分并将其发布到注册表。

例如:

    schema = {"type": "record",
"name": schemaName,
"fields": [
{"name": key, "type": value} for (key, value) in myDict.items()
]
}

然后可以使用 Fastavro 库来解析此模式

关于Python - 为 csv/xls 文件生成 avro 模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58484577/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com