gpt4 book ai didi

machine-learning - 识别分类中最弱的特征

转载 作者:行者123 更新时间:2023-11-30 08:49:56 26 4
gpt4 key购买 nike

基本的机器学习练习是对某些数据执行回归。例如,根据体重和年龄估计鱼的长度。

这通常是通过拥有大量训练数据集(体重、年龄、长度)然后应用一些回归分析来完成的。然后可以根据新鱼的重量和年龄来估计它的长度。

但是,假设我想解决这个问题:“我有一条已知体重 W、年龄 A 和长度 L 的鱼。假设我希望长度为 M 而不是 L,我应该如何调整 W 和 A ”。

这似乎是一个常见问题,但我不知道它叫什么。有人可以帮助我朝正确的方向前进吗?如果问题是线性的,那么如果是非线性的,您如何处理?

最佳答案

您正在寻找函数依赖

f: IR -> IR^2,  f(Weight) = (Age, Length)^T

您基本上可以使用与现在使用的相同的方法来完成此操作。只是目标是二维的,因此您需要调整损失函数。

二维空间中的简单欧几里德距离在这里不再适用,因为预测变量的大小和单位不同。因此,您必须在这里发挥创意 - 例如,您可以将两个预测变量标准化为 [0,1] 将标准化值输入到欧几里德或 L1 距离损失函数中。

一旦获得合适的损失函数,就可以照常进行:选择机器学习方法,拟合数据,做出预测。

关于选择方法:范围可以从简单且不相关(例如两个不相关的线性回归,或更一般地将两个一维输出方法堆叠在一起)到相关且更复杂:例如人工具有两个输出节点的神经网络,其中 ANN 参数相互关联。

<小时/>

最后,这是一个线性回归情况的示例。在那里你做 ansatz

(Age, Length)^T =  (a1 + b1* Weight, a2 + b2*Weight)^T

并通过最小化损失函数L来找到参数a1, b1, a2, b2,在最简单的情况下就是

L(a1,b1,a2,b2) = || Age - a1 + b1 * Weight ||^2 + || Length - a2 + b2 * Weight ||^2

此选择相当于两个独立的一维线性回归。很好。

然而,您通常还希望目标参数之间保持一致——直观地说:您更喜欢(年龄,长度) 中的两个小偏差,而不是一个大偏差和一个零偏差。这就是相关方法和损失函数发挥作用的地方。

关于machine-learning - 识别分类中最弱的特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36681207/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com