gpt4 book ai didi

python - 通过 uber/petastorm 将 ndarray 存储到 Parquet 中?

转载 作者:行者123 更新时间:2023-12-01 08:20:08 29 4
gpt4 key购买 nike

是否可以通过uber/petastorm将N维数组存储到Parquet中?

最佳答案

是的。 Petastorm 在标准 Apache Parquet 格式之上提供自定义编解码器层和模式扩展。 n 维数组/张量将被序列化为二进制 blob 字段。从用户的角度来看,这些看起来像原生类型,具体取决于您使用的环境(纯 Python/pyspark:numpy/array、Tensorflow 中的 tf.Tensor 或 PyTorch 中的 torch Tensor)。

这里有一些易于理解的示例:https://github.com/uber/petastorm/tree/master/examples/hello_world/petastorm_dataset

关于python - 通过 uber/petastorm 将 ndarray 存储到 Parquet 中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54699575/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com