python - 如何在 python 中计算(统计)幂函数与样本大小？-6ren

python - 如何在 python 中计算(统计)幂函数与样本大小？

转载作者：行者123 更新时间：2023-11-28 22:23:02

28

4

这在 python 中如何完成？

计算给定功效和 alpha 的样本量？
计算给定样本量和 alpha 的功效？

注意:我对 python 为(统计)幂函数计算提供的函数感到非常困惑:(。

有人可以帮我在这里下订单吗？

statsmodels下有两个函数:

from statsmodels.stats.power import ttest_power, tt_ind_solve_power()

我们有:

tt_ind_solve_power(effect_size=effect_size, alpha=alpha, power=0.8, ratio=1, alternative='two-sided')

我们还有:

ttest_power(0.2, nobs=sampleSize, alpha=alpha, alternative='two-sided')

还有这段代码:

import statsmodels.stats.api as sms
es = sms.proportion_effectsize(prop1, prop2, method='normal')
n = sms.NormalIndPower().solve_power(es, power=0.9, alpha=0.05, ratio=2)

我在某处找到了这个例子，但它没有解释什么是 prop1 和 prop2!

每一个都给了我不同的值(value)观。

谢谢

最佳答案

作为对上述问题的回答，我编写了这个计算功效与样本量的函数。

当调用 tt_ind_solve_power 时，您需要将一个参数保留为 None 以便进行计算。在下面的示例中，我将电源保持为 None。

我希望有人会发现它有用，欢迎任何改进。

from statsmodels.stats.power import  tt_ind_solve_power
from scipy.interpolate import interp1d
import matplotlib.pyplot as plt

def test_ttest_power_diff(mean, std, sample1_size=None, alpha=0.05, desired_power=0.8, mean_diff_percentages=[0.1, 0.05]):
    '''
    calculates the power function for a given mean and std. the function plots a graph showing the comparison between desired mean differences
    :param mean: the desired mean
    :param std: the std value
    :param sample1_size: if None, it is assumed that both samples (first and second) will have same size. The function then will
    walk through possible sample sizes (up to 100, hardcoded).
    If this value is not None, the function will check different alternatives for sample 2 sizes up to sample 1 size.
    :param alpha: alpha default value is 0.05
    :param desired_power: will use this value in order to mark on the graph
    :param mean_diff_percentages: iterable list of percentages. A line per value will be calculated and plotted.
    :return: None
    '''
    fig, ax = plt.subplots()
    for mean_diff_percent in mean_diff_percentages:
        mean_diff = mean_diff_percent * mean
        effect_size = mean_diff / std

        print('Mean diff: ', mean_diff)
        print('Effect size: ', effect_size)

        powers = []

        max_size  = sample1_size
        if sample1_size is None:
            max_size = 100

        sizes = np.arange(1, max_size, 2)
        for sample2_size in sizes:
            if(sample1_size is None):
                n = tt_ind_solve_power(effect_size=effect_size, nobs1=sample2_size, alpha=alpha, ratio=1.0, alternative='two-sided')
                print('tt_ind_solve_power(alpha=', alpha, 'sample2_size=', sample2_size, '): sample size in *second* group: {:.5f}'.format(n))
            else:
                n = tt_ind_solve_power(effect_size=effect_size, nobs1=sample1_size, alpha=alpha, ratio=(1.0*sample2_size/sample1_size), alternative='two-sided')
                print('tt_ind_solve_power(alpha=', alpha, 'sample2_size=', sample2_size, '): sample size *each* group: {:.5f}'.format(n))

            powers.append(n)

        try: # mark the desired power on the graph
            z1 = interp1d(powers, sizes)
            results = z1(desired_power)

            plt.plot([results], [desired_power], 'gD')
        except Exception as e:
            print("Error: ", e)
            #ignore

        plt.title('Power vs. Sample Size')
        plt.xlabel('Sample Size')
        plt.ylabel('Power')

        plt.plot(sizes, powers, label='diff={:2.0f}%'.format(100*mean_diff_percent)) #, '-gD')

    plt.legend()
    plt.show()

例如，如果您使用 mean=10 和 std=2 调用此函数，您将得到此图:

关于python - 如何在 python 中计算(统计)幂函数与样本大小？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47299824/

28

4

0

文章推荐： ios - 如何基于 NSString 以编程方式选择 uitableview 中的行

文章推荐： ios - 上周 Itunes 连接变化

文章推荐： python - 将 JSON 之类的字符串转换为 python 字典

文章推荐： python - 如何加快将数据帧导入 Pandas 的速度

来自不平衡面板数据的 R 样本
我正在处理不平衡的面板数据，我想从中抽取一个随机样本，该样本不受每个单位不同观察次数的影响。例如，在下面的代码中，IBM 被选中的可能性是 GOOG 的两倍，被选中的可能性是 MSFT 的五倍。有没有
wpf - CollectionChanged 样本
有人可以指出实现 CollectionChanged 的示例。我正在使用 wpf mvvm 灯。我试图谷歌，没有找到任何足够好的东西。最佳答案 public ObservableCollecti
带权重的 Pandas 样本
我有 df我想对某些变量的分布进行一些抽样。比方说 df['type'].value_counts(normalize=True)返回: 0.3 A 0.5 B 0.2 C 我想做类似 sampled
opengl - 样本、像素和片段之间有什么区别？
我仍然无法理解样本/像素/片段之间有什么区别。由于片段着色器按像素执行，我认为片段只是指一个像素，这是正确的吗？谁能给我一个例子和每个人的定义？最佳答案片段着色器按片段执行并发出像素。它们非常相
ios - 了解音频的帧/样本
我正在尝试理解这个名为“The Amazing Audio Engine”的 GitHub 项目，它简化了在 iOS 上处理音频的过程。我从麦克风捕捉并使用这种方法: id receiver = [
c++ - QTableView - 样本
如何在诺基亚 Qt SDK(用于手机)中使用 QTableView。我引用了一些文档，但我仍然不清楚 QTableView。请任何人建议如何使用 QTableView。我想显示具有三列的 QTabl
java - JmDNS 样本
我已经能够获取 JmDNS 附带的示例来编译和运行，但是我无法获取任何类来发现我的服务。我正在运行一个 Windows 环境，多台 PC 运行 VNC、SSH 和 Apache，我一直在尝试让 Jm
python - 在一个范围内生成均匀分布的倍数/样本
问题的具体实例我的整数范围是 1-100。我想生成此范围内的 n 个总数，这些数字尽可能均匀分布并包括第一个和最后一个值。示例 start = 1, end = 100, n = 5 Outp
jmeter - 从摘要报告中排除 JSR223 样本
我在线程组中有几个带有脚本的 JSR 223 采样器，它们在执行在调用 HTTP 请求之前进行一些工作。问题在于 JSR 233 采样器包含在最终摘要报告中我的问题是如何从最终计算中排除那些 JS
ios - 良好的后端方式来存储iOS应用的歌曲(音频)样本？
我需要有关存储后端歌曲预览的好方法的建议(现在正在查看iTunes，也许还有spotify和soundcloud)。我的想法是，我需要预下载并可能缓存30秒及更少的音频文件，以方便召回。然后，我需要
java - 如何运行 Atmosphere 样本？
我刚刚从 Github 下载了 Atmosphere 样本。当我在聊天样本上运行 jetty:run goal 时，我遇到了一些问题。我可以使用浏览器访问该页面(http://localhost:9
r - 洗牌向量 - 样本()的所有可能结果？
我有一个包含五个项目的向量。 my_vec 有更换，当我需要时没有更换。最有效的方法是什么？请注意，在我的向量中，我有两次值“a” - 因此，在返回的打乱向量集中，它们都应该有两次“a”。最佳答案
python - 如何解释这两个未压缩的 zlib 样本？
我正在尝试学习如何阅读规范。让我们看看尝试压缩后会得到什么:1) 一个空缓冲区和 2) 一个感叹号: >>> zlib.compress(b'', 0) b'x\x01\x01\x00\x00\xff
CUDA 样本 matrixMul 错误
我是 cuda 的新手，几周前才开始阅读有关并行编程和 cuda 的内容。在我安装了 cuda 工具包之后，我正在浏览 sdk 示例(安装工具包时附带的)并想尝试其中的一些。我从 0_Simple 文
f# - 大小值是否用于使用自定义生成器的 Gen 样本？
我正在使用 FsCheck 生成自定义数据的 Gen . 假设你有一个函数返回 Gen : let chooseRectangle widthMax heightMax offset = gen
python - 如何在多个列上进行 Pandas 样本？
我有一个包含大约 800 万个观察值的数据框。我需要从中提取样本，但想从多个列中采样。我尝试了以下方法，但不起作用: import pandas as pd state = ['mi', 'mi',
android - 找不到 FingerPaint 样本
我学习安卓图形，我遇到了一个奇怪的问题: 我发现很多提到“FingerPaint”样本的地方，但我在样本文件夹中找不到它。只有 47 个示例项目，没有一个是关于图形的。如何下载此示例？我按照这
python - 基于每行类别的 Pandas 样本
假设我有一个 pandas 数据框 rid category 0 0 c2 1 1 c3 2 2 c2 3 3 c3 4 4
python - 基于标准的 Pandas 样本
我想用 Pandas sample功能，但具有不分组或过滤数据的标准。 import pandas as pd import numpy as np df = pd.DataFrame(np.rand
python - 绘制 MNIST 样本
我正在尝试从 MNIST 数据集中绘制 10 个样本。每个数字之一。这是代码: import sklearn import pandas as pd import matplotlib.pyplot

首页

博学

6Ren·AI

商城

python - 如何在 python 中计算(统计)幂函数与样本大小？