gpt4 book ai didi

dataframe - 机器学习中的数据类型

转载 作者:行者123 更新时间:2023-11-30 09:58:10 26 4
gpt4 key购买 nike

我有不同数据类型的表。我的一些专栏是:

名称、时间、日期、文件数、工作时间、作业类型

Jack, 10:24:54, 2015-02-15, 82, 20, 项目经理….等等

我想通过使用随机森林模型来训练这些特征来预测公司的工作类型。我的问题是我是否应该将列转换为特定的数据类型以获得良好的准确性,时间和数据又如何?我有大约 48970 行,这是我第一次使用机器学习。

最佳答案

是的,需要转换数据。通常所有列都应采用数字格式:

  • 您可以从时间中提取特征 - 天、小时、周等;
  • 工作类型是一个分类特征,常见的转换方法有labelencoding和onehotencoding;
  • 对于其他分类列(例如名称)也可以执行相同的操作;
  • 如果使用线性模型,则应对数值特征进行归一化;

关于dataframe - 机器学习中的数据类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60141987/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com