gpt4 book ai didi

sql - 使用非精确测量(模糊逻辑)查找一系列数据

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:36:58 24 4
gpt4 key购买 nike

这是一个更复杂的后续问题:Efficient way to look up sequential values

每个Product 可以有许多Segment 行(数千)。每个分割市场都有从每个产品(1、2、3、4、5 等)1 开始的位置 列和一个可以包含任何值的 列,例如如(323.113、5423.231、873.42、422.64、763.1 等)。数据是只读的。

将产品视为歌曲,将片段视为歌曲中的一组音符可能会有所帮助。

给定一个连续片段的子集,例如歌曲的片段,我想确定产品的潜在匹配项。但是,由于测量中存在潜在误差,子集中的片段可能与数据库中的片段完全匹配。

如何通过找到与我测量的分割市场子集最匹配的产品分割市场来识别候选产品?另外,数据库是此类数据的最佳媒介吗?

-

这里只是关于我将如何解决这个问题的一些想法。 请不要将这些作为确切的要求。我对任何类型的算法都持开放态度,以使这项工作尽可能完美。我在想需要有多个阈值变量来确定接近度。一种可能性是实现接近度阈值和匹配阈值。

例如,给定这些值:

Product A contains these segments: 11,21,13,13,15.
Measurement 1 has captured: 20,14,14,15.
Measurement 2 has captured: 11,21,78,13.
Measurement 3 has captured: 15,13,21,13,11.

如果接近度阈值允许测量段高于或低于实际段 1,则测量 1 可能与产品 A 匹配,因为尽管许多段并不完全,它们在相对于实际值的接近阈值内。

如果匹配阈值允许测量匹配 3 或更多,则测量 2 可能会返回产品 A,因为尽管其中一个段 (78) 远远超过接近阈值,但它仍然匹配 3段顺序正确,因此在匹配阈值内。

测量 3 与产品 A 不匹配,因为尽管所有测量的分割都存在于实际分割中,但它们不在接近或匹配阈值内。

更新:其中一个答案要求我定义最接近匹配 的意思。我不确定如何回答这个问题,但我会尝试继续用歌曲类比来解释。假设这些片段代表录制歌曲的最大频率。如果我再次录制同一首歌曲,它会很相似,但由于背景噪音和录音设备的其他限制,一些频率会匹配,一些会接近,还有一些会相差甚远。在这种情况下,您将如何定义一个录音何时“匹配”另一个录音?这与我希望在这个问题中使用的匹配逻辑相同。

最佳答案

根据您发布的信息,可以使用 edmond 的 blossom v 完美匹配算法解决此问题。您可以最小化或最大化函数,它总能找到最佳匹配。也许您可以使用带有 2 个循环的蛮力解决方案。关于埃德蒙匹配算法的维基百科:http://en.wikipedia.org/wiki/Edmonds%27s_matching_algorithm

关于sql - 使用非精确测量(模糊逻辑)查找一系列数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8042327/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com