gpt4 book ai didi

machine-learning - 机器学习中的大量特征不好(回归)?

转载 作者:行者123 更新时间:2023-11-30 09:29:36 28 4
gpt4 key购买 nike

我正在对公寓特征进行线性回归分析,然后预测公寓的价格。目前,我已经收集了我所在城市 13000 套公寓的特征。我有 23-25 个特征,我不确定在公寓价格预测中拥有如此多的特征是否正常。

我有以下功能:
区、小区、住宅社区、建筑年份、房屋建筑 Material 、房间数量、层数、总面积、居住面积、状况、地板 Material 、浴室类型、阳台、门类型、固定电话、互联网连接类型、 parking 位可用性、家具可用性、天花板高度、安全性。

有这么多的回归特征正常吗?这些特征是否适合对公寓进行线性回归分析?由于冗余,减少特征数量并删除一些特征可能会更好吗?我的案例(公寓价格预测)中的大量特征是否有可能导致过度拟合?

最佳答案

您是如何找到这些功能的?您是否已经在数据集上运行了特征选择算法?我真的很怀疑。我不知道您已经执行了哪些步骤,但是在开始解决机器学习问题时,您首先必须对数据有一些直觉:

  1. 查看制作直方图、相关图的数据...例如,面积和房间数量可能高度相关...

  2. 如果你想进行线性回归,你必须确保与你的目标变量(即价格)的关系确实是线性的:可能需要使用原始特征的一些函数来获得线性关系

  3. 一旦您对似乎有用的功能有了更好的了解,您就可以使用一些功能选择算法(例如,如果您使用的是 python,则在 sklearn 中打包的算法)

关于machine-learning - 机器学习中的大量特征不好(回归)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34075553/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com