- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我的意图是让代码对给定列表执行引导(统计)样本量等于列表长度 10,000 次,然后计算95% 置信区间。
import numpy
from random import choice
class bootstrapping(object):
def __init__(self,bslist=[],iteration=10000):
self.bslist = bslist
self.iteration = iteration
def CI(self):
listofmeans = []
for numbers in range(0,self.iteration):
bootstraplist = [choice(self.bslist) for _ in range(len(self.bslist))]
listofmeans.append(sum(bootstraplist) / len(bootstraplist))
s = numpy.std(listofmeans)
z = 1.96
n = self.iteration**0.5
lower_confidence = (sum(listofmeans) / len(listofmeans)) - (z*s/n)
upper_confidence = (sum(listofmeans) / len(listofmeans)) + (z*s/n)
return lower_confidence,upper_confidence
test = bootstrapping([60,33,102,53,63,33,42,19,31,86,15,50,
45,47,26,23,30,20,18,48,22,20,17,29,43,52,29],10000)
test.CI()
我得到的置信区间 (37.897427638499948, 38.102572361500052) 是奇怪的狭窄。当我将相同的数字列表输入 Minitab 时,95%我得到的置信区间是 (30.74, 47.48)。我做错了什么吗?
最佳答案
要找到 95% 的置信区间,让 z = 1.96
(近似值)并计算平均值的区间,加上或减去 z*std
其中 std
是标准偏差。换句话说,使用 z*std
而不是 z*std/n
:
import numpy as np
import random
random.seed(2017)
class Bootstrapping(object):
def __init__(self,bslist=[],iteration=10000):
self.bslist = bslist
self.iteration = iteration
def CI(self):
listofmeans = []
for numbers in range(0,self.iteration):
bootstraplist = [random.choice(self.bslist) for _ in range(len(self.bslist))]
mean = sum(bootstraplist) / len(bootstraplist)
listofmeans.append(mean)
mean = np.mean(listofmeans, axis=0)
std = np.std(listofmeans, axis=0)
z = 1.96
err = z*std
lower_confidence = mean - err
upper_confidence = mean + err
return lower_confidence, upper_confidence
test = Bootstrapping([60,33,102,53,63,33,42,19,31,86,15,50,
45,47,26,23,30,20,18,48,22,20,17,29,43,52,29],10000)
print(test.CI())
产量
(31.309540089458281, 46.876348799430602)
或者,您可以计算置信区间而不求助于均值 +/-1.96*std 公式。您可以通过对 listofmeans
进行排序并找到第 5 个和第 95 个百分位数的值来获得置信区间的经验估计值:
import random
random.seed(2017)
class Bootstrapping(object):
def __init__(self,bslist=[],iteration=10000):
self.bslist = bslist
self.iteration = iteration
def CI(self):
listofmeans = []
for numbers in range(0,self.iteration):
bootstraplist = [random.choice(self.bslist) for _ in range(len(self.bslist))]
mean = sum(bootstraplist) / len(bootstraplist)
listofmeans.append(mean)
listofmeans = sorted(listofmeans)
a, b = round(self.iteration*0.05), round(self.iteration*0.95)
lower_confidence = listofmeans[a]
upper_confidence = listofmeans[b]
return lower_confidence, upper_confidence
test = Bootstrapping([60,33,102,53,63,33,42,19,31,86,15,50,
45,47,26,23,30,20,18,48,22,20,17,29,43,52,29],10000)
print(test.CI())
产量
(32.888888888888886, 45.888888888888886)
关于python - 我创建了一个类来在引导后返回置信区间,但我的置信区间看起来异常狭窄。我做错了什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41989866/
我在 Python 中使用 matplotlib,并制作了一个带条形的直方图。现在,当直方图出现时,仅 5 的倍数出现在 x 轴上,1000 的倍数出现在 y 轴上。对于 y 轴,这完全没有问题,但对
我正在使用 JavaScript 和 jQuery。我有以下脚本每 30 秒提醒一次 hi。 $(document).ready( function() { alert("hi"); setI
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。 我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题,以便
在 Numpy(python 包)中,可以使用语法 numpy.linspace(minValue, MaxValue, numberOfSamples) 构造 float 的离散区间。 . 我看到
所以我想在 -3 到 3 的区间内制作一些数字,以便在下面绘制这些函数,所以我想要尽可能多的数字。 我这样做: double k[601]; double y[601]; for (int i = 0
我有一个 Postgresql 表,用于存储有关计划进程的信息,包括上次执行进程的时间。不同的进程对其运行频率有不同的要求。 我列出了需要重新运行的进程列表: SELECT * FROM proces
如何正确使用此类带日期间隔的查询 @SqlUpdate("delete fromlogin where created < now() - ':days days' :: interval") v
我正在尝试计算图中的间隔,我在维基百科上找到了算法的数学描述: http://en.wikipedia.org/wiki/Interval_(graph_theory) H = { n0 }
我有一个基于 Informix-SQL 的 Pawnshop 应用程序,该应用程序根据黄金的重量和纯度计算应向客户贷出多少钱。当铺的最低贷款额为 5.00 美元。当铺员工通常会借出以 5 或 0 结尾
我将 NHibernate 与代码映射一起使用,并且我有一个由此公式创建的属性。 Property(x => x.IsInOverdue, mapper => mapper .Fo
我正在尝试从头开始为 Beta 分布编写卡方拟合优度检验,而不使用任何外部函数。下面的代码报告“1”适合,即使来自 scipy.stats 的 kstest 返回零。数据是正常分布的,所以我的函数也应
如何在 C# 中将任何值四舍五入到 10 区间?例如,如果我有 11,我希望它返回 10,如果我有 136,那么我希望它返回 140。 我可以很容易地用手做 return ((int)(number
如何在 Go 中表示 PostgreSQL 区间? 我的结构看起来像这样: type Product struct { Id int Name
我想编写一个函数,将数值限制在封闭的 0,1 区间内: func clamp01(_ value:T) -> T { return value 1 ? 1 : value } 在 Swift 3
我有一个简单的表格,用于存储来自在线仪表的降水读数。这是表定义: CREATE TABLE public.precip ( gauge_id smallint,
a = y def __gt__(self, y): return not self.x > y def __eq__(self, y): return
我正在处理 pandas 数据框 D=pd.DataFrame(data=[1.0,2.0,2.0,2.0,5.0,3.0,2.0,2.0,5.0,5.0,8.0,1.0]) 我识别低于特定阈值的值
我编写了一些C++代码来解决此问题: #include #include using namespace std; unsigned int countSetBits(unsigned int n
好的,我知道之前有人用一个有限的缩放示例问过这个问题 [-1, 1]间隔 [a, b] Different intervals for Gauss-Legendre quadrature in num
我是一名优秀的程序员,十分优秀!