gpt4 book ai didi

c++ - C/C++如何计算数值数据集的条纹度?

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:34:46 25 4
gpt4 key购买 nike

谁知道如何用C/C++计算数据的条纹度?条纹的定义是偏离平均值的多少(即运行平均值的数字数据条纹。感谢您的帮助。

[编辑] 来 self 们公司的首席软件架构师,这是对统计度量的要求。有人可以根据我们架构师对数据条纹的定义来定义一个统计公式吗? -- 2013 年 2 月 19 日上午 8:00

相等的数字是连胜。 1,2,3,3,3,4,5 连胜 7。

情况 A:1,2,3,4,5,6,7,8,9,10,11,12,13 的最长连胜数为 13。

情况 B:1,2,3,4,5,6,7,3,8,9,10,11,12 的最长连胜数为 7,第二个较短的连胜数为 6。

情况 C:1,2,3,4,5,6,7,1,2,3,4,5,6 的最长连胜数为 7,第二个较短的连胜数为 6。

情况 D:1,2,3,4,5,6,7,1,2,3,1,2,1 的最长连胜数为 7,第二短的连胜数为 3,第三短的连胜数共 2

案例 E:1,2,3,4,5,6,7,6,5,4,1,2,3 的最长连胜数为 7,第二个较短的连胜数为 3。

情况 F:1,2,3,4,5,6,7,6,5,4,3,2,1 的最长连胜数为 7,没有更短的连胜数。

案例 A – F 按“排序最多到排序最少”的顺序排列,但都具有相同长度的最长连胜。使用连胜长度的平均值是不合适的:

A:平均值 = 13/1 = 13

B:平均值 = (7+6)/2 = 6.5

C:平均值 = (7+6)/2 = 6.5

D:平均值 = (7+3+2)/3 = 4

E:平均值 = (7+3)/2 = 5

F:平均值 = 7/1 = 7

考虑非条纹(将它们计为 1):

A:平均值 = 13/1 = 13

B:平均值 = (7+6)/3 = 4.3

C:平均值 = (7+6)/2 = 6.5

D:平均值 = (7+3+2+1)/4 = 3.25

E:平均值 = (7+1+1+1+3)/5 = 2.6

F:平均值 = (7+1+1+1+1+1+1)/7 = 1.85

变量 R 可用于指示特定条纹与平均值的偏差有多少。根据所公开的实现例,条纹的水平不仅可以定义为距平均值的(整数*偏差)距离,还可以定义为(整数*分数偏差)距离。为此,可以使用可变 R 因子。 R 因子表示两个连续 R 水平之间的分离度,以偏差的分数表示。通过改变 R 因子,可以根据需要对条纹进行排序。但是,连胜的“可信度”也应该考虑在内,并纳入排名机制。条纹内的偏差是数据在条纹内的交错程度的明显度量。好的连胜应该少一些交错,或者换句话说,少一些偏差。出于这个原因,一个非常高水平的连胜被认为是好的,即使它的偏差比通常所期望的要大。因此,虽然水平 R 对排名产生积极影响,但连胜内的偏差对其产生负面影响。

最佳答案

抱歉,如果这有误,但我是从图像处理的角度来看的。

我见过的一种更有趣的散点图分析方法是“图论 scagnostics”或简称“scagnostics”(散点图诊断),由 Tukey 提出,后来由 Wilkinson 撰写。除了“拉丝性”之外,还有其他几个有趣的形状/簇标识符。

如果您的数据在 2 空间或 3 空间中,有一些图像处理算法可以识别数据条纹,但我必须查看一些示例数据图/图像以提供任何进一步的建议。

关于c++ - C/C++如何计算数值数据集的条纹度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14939983/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com