gpt4 book ai didi

arrays - 不同长度数组之间的平均值

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:53:05 24 4
gpt4 key购买 nike

我正在尝试开发一种非常简单的机器学习示例来识别数组之间的相似性。出于这个原因,我试图计算 2 个不同长度的数组之间的平均值。

例如,如果我有:

array_1 = [0, 4, 5];
array_2 = [4, 2, 7];

平均值是:

average_array = [2, 3, 6];

但是如果我有以下情况,我该如何设法计算平均值:

array_1 = [0, 4, 5, 10, 7];
array_2 = [4, 2, 7];

如您所见,数组的长度不同。有没有一种算法可以用来解决这个问题?有人有想法或建议吗?

当然我可以把第二个数组的缺失值看成0,求平均值,例如:

average_array = [2, 3, 6, 5, 3.5];

或将值视为“null”并具有:

average_array = [2, 3, 6, 10, 7];

但这两种方法好吗?或者有更聪明的东西?

感谢您的帮助!

最佳答案

为了回答您的问题,我们确实需要更多关于您想要实现的目标的信息。

I'm trying to develop a sort of very simple machine learning example to recognize similarity between arrays. For this reason I'm trying to calculate the average between 2 arrays with different length.

根据您的用例,相似性的定义可能完全不同。

例如:

  • 如果数组对声音信息进行编码,您可能想要测量相似度,如“这个声音片段是否出现在这个片段中”或“主要频率(对应于和弦)是否相同”
  • 如果数组对图像信息进行编码(适当的 DFT 和之字形编码),您可能不关心低频(数组的末尾)并且只测量数组前几个值之间的差异<
  • 如果数组对元素的某种组合进行编码(例如,这篇文章包含关键字“矩阵”40 次,关键字“SVM”27 次),值的差异可能非常重要。

一般建议:

  1. 想想你要衡量的是什么
  2. 决定什么是重要的

但总的来说,看看平滑算法。例如 Kneyser-Ney 或 Good-Turing 平滑。他们明确地处理比较长度可能不同的概率向量(换句话说,具有明确的零条目)

https://en.wikipedia.org/wiki/Good%E2%80%93Turing_frequency_estimation

关于arrays - 不同长度数组之间的平均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45456480/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com