gpt4 book ai didi

amazon-web-services - 使用 Apache Airflow 编辑存储在 AWS S3 中的 CSV,无需下载

转载 作者:行者123 更新时间:2023-12-04 18:37:30 24 4
gpt4 key购买 nike

我有一个项目需要定期转换大量 CSV 数据。此数据将存储在 S3 中,我使用运行 Ubuntu 服务器 16.04 的 EC2 实例对数据进行编辑,并使用 Apache Airflow 来路由数据。将此数据下载并重新上传到 S3 非常昂贵,有没有办法可以在内存中编辑此 CSV 数据,而无需将文件下载到 Ubuntu 实例上的本地存储?

先感谢您

最佳答案

一般来说,您可以考虑从 s3 获取 CSV 文件(使用 s3 sdk)并将其存储并转换到内存中然后保存回 s3 的程序。但它仍然需要“下载和重新上传”。唯一的区别是文件不会物理存储到本地磁盘,而是保存在程序内存中。

您也可以使用 s3fs将 s3 存储桶挂载到服务器上的目录并直接对文件执行请求的操作。
但是它们仍然需要从 s3 下载并重新上传到那里(尽管它是即时的并且对您不可见)。

希望有帮助。

关于amazon-web-services - 使用 Apache Airflow 编辑存储在 AWS S3 中的 CSV,无需下载,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58946138/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com