gpt4 book ai didi

json - 将 Parquet 从 AWS Kinesis firehose 写入 AWS S3

转载 作者:IT老高 更新时间:2023-10-28 12:54:37 34 4
gpt4 key购买 nike

我想从 Kinesis Firehose 将数据提取到 S3 中,格式为 Parquet 。到目前为止,我刚刚找到了一个暗示创建 EMR 的解决方案,但我正在寻找更便宜、更快的方法,比如直接从 Firehose 将接收到的 JSON 存储为 Parquet 或使用 Lambda 函数。

非常感谢,哈维。

最佳答案

好消息,这个功能今天发布了!

Amazon Kinesis Data Firehose can convert the format of your input data from JSON to Apache Parquet or Apache ORC before storing the data in Amazon S3. Parquet and ORC are columnar data formats that save space and enable faster queries

要启用,请转到您的 Firehose 流并单击 编辑。您应该会看到 记录格式转换 部分,如下图所示:

enter image description here

详情请参阅文档:https://docs.aws.amazon.com/firehose/latest/dev/record-format-conversion.html

关于json - 将 Parquet 从 AWS Kinesis firehose 写入 AWS S3,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45430535/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com