gpt4 book ai didi

python - 为机器学习准备数据集的正确方法是什么?

转载 作者:太空狗 更新时间:2023-10-29 21:53:10 24 4
gpt4 key购买 nike

<分区>

首先,感谢您阅读这篇文章。

我是机器学习的菜鸟,我正在尝试使用 ML 对一些数据进行分类。现在我已经完成了一些关于监督和非监督学习算法的基本阅读,例如决策树、聚类、神经网络等。

我很难理解的是为 ML 问题准备数据集的正确整体过程。

如何为机器学习准备数据集,以便衡量算法的准确性?

我目前的理解是,为了评估准确性,应该向算法提供预先标记的结果(来自数据集的重要子集?),以便评估预期结果与算法决策之间的差异?

如果这是正确的,那么如何对大型数据集进行预标记呢?我的数据集很大,手动标记不可行。

此外,我们将不胜感激有关使用 Python 进行机器学习的任何提示!

非常感谢您的提前帮助!

最好的问候,

迈克

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com