gpt4 book ai didi

interpolation - 如何在两组不规则数据之间插值?

转载 作者:行者123 更新时间:2023-12-02 22:49:39 26 4
gpt4 key购买 nike

对于这个有点令人困惑的标题,我感到很抱歉,但我不确定如何更清楚地总结这一点。

我有两组 X,Y 数据,每组对应一个总体值。它们是从原始数据中相当密集地采样的。我正在寻找一种方法,为任何给定的 Y 找到我已有的集合之间的值的插值 X。

图表使这一点更加清晰:

A graph of points

在本例中,红线来自对应于 100 的集合,黄线来自对应于 50 的集合。

我想说的是,假设这些集合对应于值的梯度(即使它们显然是由离散的 X,Y 测量值组成),我如何找到 X 的位置,如果对于对应于值 75 的集合,Y 为 500?

在此处的示例中,我希望我想要的点位于此处附近的某个位置:

A graph of points with an interpolated point

我不需要这个函数过于花哨——它可以是数据点的简单线性插值。我只是很难思考清楚。

请注意,两个集合的 X 和 Y 都没有完全重叠。然而,说“这些集合共享的最近的 X 点在哪里”或“这些集合共享的最近的 Y 点在哪里”是相当简单的。

我在已知值之间使用了简单的插值(例如,找到设置“50”和“100”的相应 Y 的 X,然后对它们进行平均以获得“75”),最终得到如下所示的结果:

Not very good interpolation

很明显我在这里做错了什么。显然,在这种情况下,对于 Y 高于“最低”集合的最大 Y 的所有情况,X (正确地)返回为 0。事情一开始很好,但是当一个人开始接近最低组的最大 Y 时,它就开始变得困惑。

很容易看出为什么我的出错了。这是看待问题的另一种方式:

Illustration

在“正确”版本中,X 应该约为 250。相反,我所做的基本上是对 400 和 0 进行平均,所以 X 是 200。在这种情况下我该如何求解 X?我认为双线性插值可能能找到答案,但我找不到任何东西可以清楚地表明我将如何处理这类事情,因为它们似乎都是针对有些不同的问题而构建的。

感谢您的帮助。请注意,虽然我已经在 R 中将上述数据绘制成图表,以便更容易了解我在说什么,但最终的工作是在 Javascript 和 PHP 中完成。我并不是在寻找繁重的任务;简单更好。

最佳答案

天哪,我终于明白了。最终结果如下:

The final product

美丽!但这是一项多么艰巨的工作啊。

我的代码太乱七八糟,而且对于我的项目来说太具体,对其他人来说没有多大用处。但这是基本逻辑。

您必须有两组数据才能进行插值。我将它们称为“外部”曲线和“内部”曲线。假定“外部”曲线完全包围“内部”曲线且不与“内部”曲线相交。这些曲线实际上只是 X、Y 数据集,并对应于定义为 Z 的一组值。在此使用的示例中,“外部”曲线对应于 Z = 50,“内部”曲线对应于 Z = 100 .

重申一下,目标是为任何给定的 Y 找到 X,其中 Z 是我们已知数据点之间的某个数字。

  1. 首先计算未知 Z 代表的两个曲线集之间的百分比。因此,如果在我们的示例中 Z=75,则结果为 0.5。如果 Z = 60,则为 0.2。如果 Z = 90,则为 0.8。将此比例称为 P。

  2. 选择“外部”曲线上的数据点,其中 Y = 所需的 Y。想象该点和 0,0 之间的线段。将其定义为AB。

  3. 我们想要找到 AB 与“内部”曲线相交的位置。为此,我们迭代内部曲线上的每个点。将所选点与点+1 之间的线段定义为 CD。检查AB 和CD 是否相交。如果没有,请继续迭代,直到完成为止。

  4. 当我们找到 AB-CD 交点时,我们现在查看由交点和步骤 2 中“外部”曲线上的原始点创建的线。那么,该线段是内部和外部曲线,如果线的斜率继续“向下”图表,将与 0,0 相交。定义这个新线段为EF。

  5. 找到 EF 长度的 P%(来自步骤 1)的位置。检查 Y 值。是我们想要的Y值吗?如果是(不太可能),则返回该点的 X。如果不是,则查看 Y 是否小于目标 Y。如果是,则将该点的位置存储在变量中,我将其称为 lowY。然后再次返回步骤 2 以获取外部曲线上的下一个点。如果它大于目标 Y,请查看 lowY 中是否有值。如果是,则在两个值之间进行插值并返回插值后的 X。(换句话说,我们已经将所需的坐标“装箱”了。)

上述过程效果很好。它在 Y=0 的情况下失败,但很容易做到这一点,因为您只需对这两个特定点进行插值即可。在样本数量少得多的地方,它会产生锯齿状结果,但我想这是可以预料的(这些是 Z = 5000,6000,7000,8000,9000,10000,其中只有 5000 和 10000 是已知点他们每个只有 20 个数据点 - 其余的都是插值的):

Jaggy results

我并不认为这是一个优化的解决方案,但在我的计算机上解决大量点实际上是瞬时的,所以我认为这对于现代机器来说并不太费力,至少从我拥有的总点数来看(每条曲线 30-50)。

感谢大家的帮助;稍微讨论一下这个问题并意识到我真正想要的不是任何简单的线性插值,而是沿着曲线的一种“径向”插值,这对我很有帮助。

关于interpolation - 如何在两组不规则数据之间插值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20456476/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com