gpt4 book ai didi

algorithm - 近似样本的典型值

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:32:20 26 4
gpt4 key购买 nike

假设我有一个包含 N 个正实数的样本,我想找到这些数字的“典型”值。当然,“典型”的定义不是很明确,但可以想到以下更具体的问题:

这些数字的分布使得(粗略地说)它们的一小部分(1-epsilon)是从具有正均值 m > 0 和均方差 sigma << m 的高斯分布中提取的,并且它们的一小部分 epsilon 被绘制出来来自其他一些分布,对于大数字和小数字都是重尾分布。我想估计几个标准偏差内的高斯均值。

一个解决方案是计算中位数,但虽然它是 O(N),但常数因子对于中等 N 并不是很好,而且它需要相当多的编码。我准备放弃我对代码简单性和/或小 N 性能的估计的精度(例如,假设 N 为 10 或 20,并且我最多有一个或两个异常值)。

你有什么建议吗?

(例如,如果我的离群值仅来自大值,我会计算我的值的对数的平均值并将其取幂。在一些进一步的假设下,这通常会给我一个很好的估计,我可以计算它轻松且具有尖锐的 O(N))。

最佳答案

您可以取除最小值和最大值之外的数字的平均值。公式为 (sum - min - max)/(N - 2),分子中的项可以简单地计算一次(不过要注意 float 问题)。

关于algorithm - 近似样本的典型值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29629843/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com