gpt4 book ai didi

对数字集的相似性进行评分的算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:52:25 25 4
gpt4 key购买 nike

将多组数字与目标集进行比较以确定哪些数字最“相似”的算法是什么?

此算法的一个用途是将今天每小时的天气预报与历史天气记录进行比较,以找到天气相似的一天。

两个集合的相似性有点主观,所以算法实际上只需要区分好匹配和坏匹配。我们有很多历史数据,所以我想通过自动抛出不接近的集合并尝试将“最佳”匹配放在顶部来尝试缩小用户需要查看的天数列表。

编辑:理想情况下,算法的结果与使用不同数据集的结果具有可比性。例如,使用 Niles 建议的均方误差产生了相当不错的结果,但是比较温度时生成的数字不能与风速或降水等其他数据生成的数字进行比较,因为数据的规模不同。一些非天气数据非常大,因此均方误差算法会生成数十万的数字,而使用温度生成的数字则为数十或数百。

最佳答案

我认为均方误差指标可能适用于天气比较等应用。它很容易计算并给出有意义的数字。

由于您想比较一段时间内的测量值,您可以在计算中忽略缺失值。

对于没有时间限制甚至未排序的值,多维散点数据,它有点困难。选择一个好的距离度量成为分析此类数据的一部分。

关于对数字集的相似性进行评分的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/139811/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com