- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
帮助链接是http://docs.scipy.org/doc/scipy-0.7.x/reference/generated/scipy.stats.kstest.html我现在可以计算 ks-test 值,但我不明白。代码如下。
from scipy import stats
import numpy as np
sample =np.loadtxt('mydata',delimiter=",",usecols=(2,),unpack=True)
print stats.kstest(sample, 'poisson', args=(1,))
第一季度
如果引用分布不变,上面的'poisson'可以用什么词代替?
第二季度args=(1,)
是什么意思?
第三季度
如果有人对 ks-test 感兴趣,这里是 wiki 链接。
http://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test
可以自己写python代码来练习吗? max(D)很容易得到,但是如何得到链接中的Pr(k<=x)呢? max(D) 和 Pr(k<=x) 有什么关系?
最佳答案
Q2:看看这个,我有一个名为x1
>>> stats.kstest(x1, 'norm')
(0.50018855199491585, 0.0)
>>> stats.kstest(x1, stats.norm.cdf)
(0.50018855199491585, 0.0)
>>> stats.kstest(x1, stats.norm.cdf, args=(0,))
(0.50018855199491585, 0.0)
>>> stats.kstest(x1, stats.norm.cdf, args=(2,))
(0.84134903906580316, 0.0)
>>> stats.kstest(x1, 'norm', args=(2,))
(0.84134903906580316, 0.0)
如果您传递分布名称,即 'norm'
,实际传递给 kstest
的是标准分布 cdf
。按照标准,这意味着 mean==0 和 sigma=1 的正态分布。如果您不想要标准的 cdf
,您可以使用 args=()
将额外的参数传递给 cdf
。在这种情况下,我只通过了平均值。也就是说,我们测试了 x1
与 mean==2 和 sigma=1 的正态分布之间的差异。
Q3:简短的回答是,是的。但是,为什么要重新发明轮子?如果你想知道它是如何实现的,只要查看源代码就可以了。它位于 your_package_folder\scipy\stats\stats.py
,第 3292 行。
关于python - 如何使用scipy.stats.kstest/关于Kolmogorov-Smirnov检验的基本问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19009530/
给定infinite time ,我们可以接近字符串的确切 Kolmogorov complexity .如果我们没有无限时间,我们仍然可以计算字符串的 Kolmogorov 复杂度的上限: ...s
我正在寻找一种可以计算给定输入字符串的 Kolmogorov 复杂度近似值的算法。因此,如果 K 是字符串 S 的 Kolmogorov 复杂度,而 t 表示时间,则该函数的行为类似于这样......
你好 我需要在应用中使用这个 Kolmogorov 过滤器。您将一些测量数据放入其中,并使用过滤器对其进行一些平滑处理。我试着用“nchoosek”来做,但是当我尝试为 50 或更多的 I 做这件事时
我正在研究使用压缩来衡量文档与文档语料库之间的关系。在这样做的过程中,我在使用 bzip2 时发现了一个奇怪的结果; len(compress(corpus)) > len(compress(corp
据说,不可压缩性方法可以简化对一般情况的算法分析。据我了解,这是因为不需要计算该算法的所有可能输入组合,然后得出平均复杂度。相反,将单个不可压缩的字符串作为输入。由于不可压缩字符串是典型的,我们可以假
我很难让 ks.test 使用卡方分布式数据: > chi10 ks.test(chi10, dchisq, df=10) One-sample Kolmogorov-Smirnov tes
我正在寻找一个基于Python的Kolmogorov-Zurbenko过滤器,它接收时间序列输入并根据窗口大小和迭代次数对其进行过滤,但尚未找到任何似乎有效的东西。有人比我运气更好吗? 谢谢! 最佳答
我正在寻找一种为 MathCad 生成 Kolmogorov-Chapman 方程来解决马尔可夫链问题的方法。问题是找到系统处于其中一种状态的概率。系统有N个组件。我有一个包含 2^N 个节点(状态)
已关闭。此问题旨在寻求有关书籍、工具、软件库等的建议。不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以
我说的是用 python 公式检索这个表媒体的值 https://www.soest.hawaii.edu/GG/FACULTY/ITO/GG413/K_S_Table_one_Sample.pdf
假设我们有两个样本 data1 和 data2 以及它们各自的权重 weight1 和 weight2 并且我们想计算两个加权样本之间的 Kolmogorov-Smirnov 统计量。 我们在 pyt
我正在尝试为我的数据获得最佳分布。试衣完成如下图所示,但我需要测量,以选择最佳型号。我将拟合优度与卡方值进行比较,并使用 Kolmogorov-Smirnov (KS) 检验检验观察分布和拟合分布之间
我使用以下Python代码向学生演示随机变量的生成: import numpy as np import scipy.stats as stats def lcg(n, x0, M=2**32, a=
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 7 年前。 Improve this qu
在进行重要性抽样实验时,我模拟了 Kolmogorov-Smirnov 距离的值 $$ D_n =\max_x |\hat{F}_n(x)-F(x)| $$ 其中 $n$ 是原始重要性样本的大小,我想
柯尔莫哥洛夫-斯米尔诺夫统计量定义为经验累积分布函数与假设累积分布函数之间的最大距离。我认为,与其看数字,不如使用图表来找出最大差异。 我知道如何绘制经验分布函数 p1<-qplot(rnorm(30
我对 R 中的 ks 函数有疑问。我有一个拉普拉斯分布: ldes <- function(y, a) { if(y < 0.5) 1/a*log(2*y, 2) else 1/a*log(
我在 Spark 中有两组数据(我们称它们为 d1、d2)。我想执行两个样本柯尔莫哥洛夫-斯米尔诺夫检验,以测试它们的底层总体分布函数是否不同。 MLLib 的 Statistics.kolmogor
我设计了 3000 个实验,因此在一个实验中有 4 组(治疗组),每组有 50 个人(受试者)。对于每个实验,我都会做一个标准的单向方差分析,并证明它们的 p.values 在零假设下是否具有单一概率
我有一组实验值和一个概率密度函数,据说可以描述它们的分布: def bekkers(x, a, m, d): p = a*np.exp((-1*(x**(1/3) - m)**2)/(2*d*
我是一名优秀的程序员,十分优秀!