gpt4 book ai didi

interpolation - 如何在两组不规则数据之间插值?

转载 作者:行者123 更新时间:2023-11-28 19:05:32 26 4
gpt4 key购买 nike

我很抱歉标题有点困惑,但我不确定如何更清楚地总结这一点。

我有两组X,Y数据,每组对应一个大概的整体值。它们是从原始数据中相当密集地采样的。我正在寻找的是一种方法,可以为我已有的集合之间的值找到任何给定 Y 的插值 X。

图表使这一点更清楚:

A graph of points

在这种情况下,红线来自对应于 100 的集合,黄线来自对应于 50 的集合。

我想说,假设这些集合对应于值的梯度(即使它们显然由离散的 X、Y 测量值组成),我如何找到,比如说,如果对于对应于值 75 的集合,Y 为 500?

在这里的例子中,我希望我想要的点在附近的某个地方:

A graph of points with an interpolated point

我不需要这个函数太花哨——它可以是数据点的简单线性插值。我只是想不通。

请注意,两组的 X 和 Y 都不完全重叠。然而,“这些集合共享的最近的 X 点在哪里”或“这些集合共享的最近的 Y 点在哪里”是相当微不足道的。

我在已知值之间使用了简单的插值(例如,为集合“50”和“100”找到相应 Y 的 X,然后将它们取平均值得到“75”),我最终得到如下所示的结果:

Not very good interpolation

很明显我在这里做错了什么。显然,在这种情况下,对于 Y 高于“最低”集合的最大 Y 的所有情况,X(正确地)返回为 0。事情一开始很好,但是当一个人开始接近最低集合的最大 Y 时,它开始变得困惑。

很容易看出为什么我的出错了。这是看待问题的另一种方式:

Illustration

在“正确”版本中,X 应该约为 250。相反,我所做的实际上是对 400 和 0 进行平均,因此 X 为 200。在这种情况下我该如何求解 X?我在想双线性插值可能会找到答案,但我找不到任何东西可以清楚地说明我将如何处理这类事情,因为它们似乎都是为不同的问题而构建的。

感谢您的帮助。请注意,虽然我显然已经在 R 中绘制了上述数据以便于了解我在说什么,但最终的工作是在 Javascript 和 PHP 中。我不是在寻找繁重的工作;越简单越好。

最佳答案

天哪,我终于明白了。这是最终结果:

The final product

漂亮!但这是多么大量的工作。

我的代码太乱七八糟,而且对我的项目来说太具体了,对其他人没有多大用处。但这是基本逻辑。

您必须有两组数据才能进行插值。我称这些为“外”曲线和“内”曲线。假设“外”曲线完全包围“内”曲线,而不与“内”曲线相交。这些曲线实际上只是一组 X、Y 数据,对应于定义为 Z 的一组值。在此处使用的示例中,“外部”曲线对应于 Z = 50,“内部”曲线对应于 Z = 100 .

重申一下,我们的目标是为任何给定的 Y 找到 X,其中 Z 是我们已知数据点之间的某个数字。

  1. 首先计算出未知 Z 代表的两个曲线集之间的百分比。因此,如果在我们的示例中 Z=75,则结果为 0.5。如果 Z = 60 那将是 0.2。如果 Z = 90 那么那将是 0.8。称这个比例为 P。

  2. 选择“外部”曲线上的数据点,其中 Y = 您想要的 Y。想象一下该点和 0,0 之间的线段。将其定义为 AB。

  3. 我们想要找到 AB 与“内部”曲线相交的位置。为此,我们遍历内部曲线上的每个点。定义所选点和点+1 之间的线段为 CD。检查 AB 和 CD 是否相交。如果不是,请继续迭代直到他们这样做。

  4. 当我们找到 AB-CD 交叉点时,我们现在查看由交叉点创建的线和我们在步骤 2 中“外部”曲线上的原始点。然后,这条线段是介于内部和外部曲线,其中直线的斜率,如果继续“向下”图表,将与 0,0 相交。将这条新线段定义为 EF。

  5. 找到 EF 长度的 P%(来自步骤 1)的位置。检查 Y 值。是我们想要的Y值吗?如果是(不太可能),则返回该点的 X。如果不是,请查看 Y 是否小于目标 Y。如果是,将该点的位置存储在一个变量中,我将其命名为 lowY。然后再次返回到第 2 步以获得外曲线上的下一个点。如果它 大于目标 Y,请查看 lowY 是否具有其中的值。如果是,则在两个值之间进行插值并返回插值后的 X。(换句话说,我们已经“框入”了我们想要的坐标。)

上述程序运行良好。它在 Y=0 的情况下失败,但很容易做到这一点,因为您可以只对这两个特定点进行插值。在样本数量少得多的地方,它会产生锯齿状的结果,但我想这是可以预料的(这些是 Z = 5000,6000,7000,8000,9000,10000,其中只有 5000 和 10000 是已知点它们每个只有 20 个数据点——其余的是插值的):

Jaggy results

我并不认为这是一个优化的解决方案,但在我的计算机上几乎可以瞬间解决大量的点,所以我认为这对现代机器来说并不太费力,至少对于我拥有的总点数而言(每条曲线 30-50)。

感谢大家的帮助;稍微讨论一下并意识到我真正想要的不是任何简单的线性插值,而是一种沿曲线的“径向”插值,这对我有很大帮助。

关于interpolation - 如何在两组不规则数据之间插值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47493154/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com