gpt4 book ai didi

matlab - 在数据中拟合多项式,matlab

转载 作者:行者123 更新时间:2023-12-04 06:00:29 24 4
gpt4 key购买 nike

我有一个非常简单的问题。我有

x = [1 2 3 4 5];
y = [5.5 43.1 128 290.7 498.4];
p = polyfit(x,y,3);
x2 = 1:.1:5;
y2 = polyval(p,x2);
plot(x,y,'o',x2,y2)
grid on

我如何证明 polyfit(x,y,4) 得到的参数不重要,所以我应该只取 polyfit(x,y,3);
问候,

最佳答案

虽然 WebMonster 使用学习和测试集的建议通常非常有值(value),但对于您提供的数据集,它是不可用的。

一般是 n三阶多项式由n+1确定参数。所以你至少需要n+1数据点以适合您的数据。为了找到系数(即参数),我们只需表达 f(x) = y所有 xy , 分别是 n+1 n+1 中的方程未知数和只要所有 x -values 是唯一的,这可以准确地解决。当数据点(方程)多于未知数时,可以计算最佳解(最常见的是最小二乘法)解。这是一种最小化模型和数据点之间距离的解决方案。

这也使您对数据集发生的事情有了一些直觉。您有 5 个点,因此四阶多项式可以在您提供的点上完美拟合数据。这意味着您的测量中存在的任何噪声都将成为您模型的一部分,即您获得的模型只有在您的数据不包含任何干扰(噪声)时才是无偏的。

但是,从这少量的数据中,您无法得出应该使用三阶或四阶模型的结论。为此,您需要更多信息。您要么需要更多数据点,要么需要有现场信息。例如。如果您知道数据是由可以用三阶多项式描述的系统生成的,那么(很可能)您应该使用它。

使用带有这个小证据的四阶模型显然是荒谬的(因为您当时假设您的测量是完美的),选择三阶模型“仅仅因为四阶模型行不通”同样愚蠢。

我为您的数据计算了最小二乘成本函数(这是由 polyfit 最小化的成本函数),即

for n = 1:4
p = polyfit(x,y,n);
ym = polyval(p,x);
e = y - ym;
V(n) = sum(e.^2)/2
end

成本函数 V(n)衡量您的模型在每个订单上的表现如何 n ,成本越高,您的合身度就越差。我计算了 V= [6269, 28.885, 28.621, 6.083e-25] .由此您可以清楚地看到,线性(一阶)模型拟合非常差,而四阶模型具有(接近)完美拟合(成本几乎为零)。但是二阶和三阶模型的性能非常相似。引入第三个参数仅使成本降低 0.264 .

您可以了解所有数据点组合与模型的偏差程度: d = sqrt(2*V) .对于第二个订单,这是 7.601而对于第三个订单,这只是 7.566 ,所以您看到的差异小于 0.04 (以您的 y 轴为单位)来判断您的模型。

如果您选择三阶模型,这意味着您认为这种差异很重要。仅查看您的上次测量结果,这相当于 0.007% 的相对不确定度。 .长话短说:我严重怀疑三阶模型是否明显优于您的二阶模型。就个人而言,我会根据这些数据使用二阶模型。

我很快根据 AIC 的调整成本函数检查了这些模型。和 MDL标准,那些表明二阶模型也优于三阶模型。这些成本函数包括对增加模型复杂度的惩罚(即 Occam's Razor),以防止过度拟合。

请注意,所有这些都与任一模型在现实生活中的表现无关。您确实需要更多数据才能得出合理的结论。当您包含更多测量值时,也可能需要四阶或更高阶的模型。

关于matlab - 在数据中拟合多项式,matlab,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8964452/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com