gpt4 book ai didi

machine-learning - 通过机器学习选择特征

转载 作者:行者123 更新时间:2023-11-30 08:58:40 25 4
gpt4 key购买 nike

我当前研究的目的是探索机器学习方法,以选择与治疗高度相关的结果,这将被视为处理多种测试的一种方法。

我的问题是:我可以使用哪种机器学习特征选择方法来找到响应变量和特征之间的强关联。

响应变量:组(= 1“治疗组”,=“对照组”)

特点:急诊科访问,医院访问,肿瘤科访问,其他访问,ED费用,住院费用,Onco费用,其他费用。

谢谢,

里昂

最佳答案

功能选择:

这是选择相关特征或变量的子集的过程。

有三种主要的子集类型:包装器,过滤器,嵌入式

包装纸:

使用基于模型的错误率对特征子集评分的预测模型。尽管需要大量计算,但是它们通常会产生最佳的功能选择。一种流行的技术称为逐步回归。

逐步回归:

它是在每次迭代中添加最佳功能或删除最差功能的算法。

筛选条件:

过滤器使用的代理度量值计算量较小,但准确性较低。因此这可能是一个不错的预测,但可能仍不是最好的。过滤器的确捕获了数据集的实用性,但是与误差测量相比,如果使用包装器,则所选功能集将更加通用。

过滤器产生的特征集不包含基于预测模型的假设,这使其成为有用的工具,可将“不良”等特征之间的关系放在一起,从而将准确性和“良好”放在一起,从而提高准确性。

嵌入式:

嵌入式算法了解在模型构建过程中哪些特征最有助于准确的模型。最常见的类型称为正则化模型。

实际上,我们可以从降维中选择模型,例如主判别分析,线性判别分析和核PCA。或者您可以XGboost模型。

关于machine-learning - 通过机器学习选择特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49542949/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com