gpt4 book ai didi

google-cloud-platform - DataBricks + Kedro Vs GCP + Kubeflow Vs 服务器 + Kedro + Airflow

转载 作者:行者123 更新时间:2023-12-03 16:32:17 29 4
gpt4 key购买 nike

我们正在 10 多家公司之间部署一个数据联盟。 Wi 将为所有公司部署多个机器学习模型(一般为高级分析模型),我们将管理所有模型。我们正在寻找一种管理多个服务器、集群和数据科学管道的解决方案。我喜欢 kedro,但不确定在使用 kedro 时管理所有内容的最佳选择是什么。
总之,我们正在寻找最佳解决方案来管理不同服务器和可能的 Spark 集群中的多个模型、任务和管道。我们目前的选择是:

  • AWS 作为我们的数据仓库和 Databricks 用于管理服务器、集群和任务。我不认为 databricks 的 notebooks 是构建管道和协作工作的好解决方案,所以我想将 kedro 连接到 databricks(它好吗?使用 databricks 安排 kedro 管道的运行容易吗? )
  • 将 GCP 用于数据仓库并使用 kubeflow (iin GCP) 来部署模型以及管道和所需资源的管理和调度
  • 从 ASW 或 GCP 设置服务器,安装 kedro 并使用气流安排管道(我发现管理 20 个服务器和 40 个管道是一个大问题)

  • 我想知道是否有人知道这些替代方案之间的最佳选择、它们的缺点和优点,或者是否有更多的可能性。

    最佳答案

    我将尝试总结我所知道的,但请注意,我并未参与 KubeFlow 项目。
    数据块上的 Kedro
    我们的方法是使用 CI 构建我们的项目,然后从笔记本执行管道。我们没有使用 kedro recommended approach使用 databricks-connect 由于 large price difference作业和交互式集群(数据库连接所需)之间。如果您正在处理数 TB 的数据,这很快就会变得相关。
    作为 DS,这种方法可能感觉很自然,但作为 SWE,虽然它不是。在笔记本中运行管道感觉很麻烦。它有效,但感觉没有工业化。 Databricks 在自动启动和关闭集群并为您处理运行时方面表现良好。所以他们的附加值是从你那里抽象出 IaaS(稍后会详细介绍)。
    GCP 和“云原生”
    :GCP 的主要卖点是 BigQuery。它是一个非常强大的平台,仅仅因为您可以从第 0 天开始工作。我见过人们在它之上构建整个 Web API。 KubeFlow 与 GCP 无关,因此您可以稍后将其移植到其他地方。 Kubernetes 还允许您在集群、API、流媒体、Web 服务、网站上运行任何您想要的任何东西。
    :Kubernetes 很复杂。如果你有 10 多名工程师长期运行这个项目,你应该没问题。但不要低估 Kubernetes 的复杂性。 Linux 之于操作系统世界,就像云之于云一样。想想日志管理、嘈杂的邻居(一个用于 Web API 的集群 + 批量 Spark 作业)、多集群管理(每个部门/项目一个集群)、安全性、资源访问等。
    IaaS 服务器方法
    你的最后一个选择,手动安装服务器是我推荐的唯一方法,前提是你有一个庞大的团队,非常大的数据,并且正在构建一个收入可以承受大量维护成本的长期产品。
    背后的人
    您所在地区的人才市场如何?如果您可以聘请具有 GCP 知识的经验丰富的工程师,我会选择第二个解决方案。 GCP 是一个成熟的“原生”平台,因为它为客户抽象了很多东西。如果您的市场主要有 AWS 工程师,那可能是一条更好的道路。如果您有许多 kedro 工程师,这也很重要。请注意,kedro 是不可知的,可以在任何地方运行。它实际上只是python代码。
    主观建议 :
    我主要从事 AWS 项目和一些 GCP 项目,我会选择 GCP。我会使用平台的组件(BigQuery、Cloud Run、PubSub、Functions、K8S)作为工具箱来选择并围绕它构建一个组织。 Kedro 可以在任何这些上下文中运行,作为调度程序触发的作业、作为 Kubernetes 上的容器或作为将数据导入(或导出)BigQuery 的 ETL 管道。
    尽管与原始 AWS 相比,Databricks 的“管理更少”,但它仍然是需要考虑的服务器和需要担心的 VPC 网络费用。 BigQuery 只是查询 GB。函数只是调用计数。这些高级组件将使您能够快速向客户展示值(value),并且您只需在扩展时更深入(RaaS -> PaaS -> IaaS)。
    AWS 在 IaaS 上也有这些更高级别的抽象,但总的来说,(对我来说)谷歌的产品似乎是最成熟的。主要是因为他们发布了在内部使用了近十年的工具,而 AWS 为市场构建了新工具。不过,AWS 是 IaaS 之王。
    最后说一点内容,two former colleagues have discussed ML industrialisation frameworks earlier this fall

    关于google-cloud-platform - DataBricks + Kedro Vs GCP + Kubeflow Vs 服务器 + Kedro + Airflow,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64921833/

    29 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com