gpt4 book ai didi

python - 如何使用 Python 中的面向对象编程来构建机器学习项目?

转载 作者:太空狗 更新时间:2023-10-29 17:20:49 25 4
gpt4 key购买 nike

<分区>

我观察到,在使用 Python(或其他语言)时,静态分析人员和机器学习科学家通常不会遵循 OOPS 进行 ML/数据科学项目。

这主要是由于在开发用于生产的 ML 代码时缺乏对 oops 中最佳软件工程实践的理解。因为他们大多来自数学和统计教育背景,而不是计算机科学。

ML 科学家开发临时原型(prototype)代码并由另一个软件团队使其生产就绪的日子在行业中已经结束。

enter image description here

问题

  1. 我们如何使用 OOP 为 ML 项目构建代码?
  2. 数据清理、特征转换、网格搜索、模型验证等每个主要任务(如上图所示)都应该是一个单独的类吗?机器学习的推荐代码设计实践是什么?
  3. 任何好的 github 链接和结构良好的代码供引用(可能是一个写得很好的 kaggle 解决方案)
  4. 像数据清理这样的每个类都应该为像 这样的每个过程都有 fit()transform()fit_transform() 函数吗remove_missing(), outlier_removal()?完成后,为什么 scikit-learn BaseEstimator 通常会被继承?
  5. 生产中的 ML 项目的典型配置文件结构应该是什么?

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com