gpt4 book ai didi

kubernetes - 在Azure Kubernetes Service(AKS)中使用Dask Kubernetes处理大数据

转载 作者:行者123 更新时间:2023-12-02 11:47:24 25 4
gpt4 key购买 nike

我想对笔记本电脑硬盘中8gb的数据集(如csv文件)进行分析。我已经在AKS上设置了一个dask kubernetes集群,其中包含1个调度程序和3个worker,每个集群有7 GB。

如何使用AKS上的dask kubernetes集群处理数据集?
为此,在 worker 之间共享数据集的哪个文件系统将是最佳选择?


我应该在哪里存储此数据集的任何建议,以便我可以轻松地处理此数据集。

该方法应该在jupyter笔记本和python文件中均有效。

最佳答案

您可能希望将数据上传到Azure Blob存储。在此处有有关远程远程数据(包括Azure)的更多信息:

https://docs.dask.org/en/latest/remote-data-services.html

关于kubernetes - 在Azure Kubernetes Service(AKS)中使用Dask Kubernetes处理大数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56416574/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com