gpt4 book ai didi

machine-learning - 如何为监督机器学习项目构建目标变量

转载 作者:行者123 更新时间:2023-11-30 09:09:06 24 4
gpt4 key购买 nike

我对机器学习很陌生,经验很少,并且做了一些项目。

现在我有一个与保险相关的项目。因此,我拥有有关客户的数据库,我将合并这些数据库以获取有关客户的所有可能信息,并且我有一个用于 claim 的数据库。我需要建立一个模型来根据排名确定客户的风险程度。

我的问题:我需要构建目标变量,根据 claim 的风险程度对客户进行排名。我可以有不同的策略来做到这一点,但我对如何处理以下问题感到困惑:- 在构建排名(例如聚类)之前我是否应该进行特定类型的分析,或者我需要有一个与项目提供商愿景相匹配的强有力的理论假设。- 如果我使用 claim 数据库中的一些变量来建立排名,以后我该如何处理它们。换句话说,我是否应该将它们从最终的训练数据集中删除,以避免与目标变量相关,或者我可以以不同的方式处理它们并保留它们。- 如果我保留它们,是否根据它们是校准变量还是连续变量对它们进行特殊处理。

最佳答案

每个机器学习项目的起点都是 EDA。首先创建一些功能,例如他们收到不良 claim 的频率或收到的数量。然后进行一些 EDA 来找出哪些功能更有用。其次,问题看起来像是分类。聚类通常更难评估。

关于machine-learning - 如何为监督机器学习项目构建目标变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44821978/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com