python实现假设检验-z检验

2024-04-09 06:04:07
开发
35

一. 什么是z检验

当总体服从正太分布 $N(\mu, \delta^2)$ 时，统计量 $\frac{\overline{X} - \mu}{\delta/\sqrt{n}}$ 服从标准正太分布，因此可以利用该统计量对样本均值 $\overline{X}$ 进行假设检验。这种检验方法称为 $z$ 检验法。

适用条件：

总体服从正态分布且方差已知，此时统计量 $\frac{\overline{X} - \mu}{\delta/\sqrt{n}}$
总体的方差未知，但样本量足够大，一般样本容量 $n$ 需要大于30，此时统计量 $\frac{\overline{X} - \mu}{S/\sqrt{n}}$

$\delta$ 为总体标准差， $S$ 为样本标准差， $\mu$ 为总体均值， $\overline{X}$ 为样本均值。

二. 常见z检验的实现

1. 单样本双边检验

假设某车间用一台包装机包装葡萄糖。已知每袋糖的净重是一个随机变量，且服从标准差为 0.015 kg 的正态分布。某日随机抽取它所包装的9袋糖，称得净重为（kg）：
$0.497 ， 0.506 ， 0.518 ， 0.524 ， 0.498 ， 0.511 ， 0.520 ， 0.515 ， 0.512$ 问每袋糖的净重的均值 $\mu$ 是不是0.5kg？

原假设： $H_0: \mu = 0.5kg$
备则假设： $H_1: \mu \neq 0.5kg$

从备则假设的形式可以得知总体的实际均值可能大于0.5kg，也可能小于0.5kg，因此它是一个双边检验，置信水平 $\alpha$ = 0.05。

代码实现：

import math
import numpy as np
from scipy.stats import norm

if __name__ == '__main__':
    # 总体标准差
    std = 0.015
    # 置信水平
    alpha = 0.05
    sample = [0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512]
    # 样本均值
    sample_mean = np.mean(sample)

    # 统计量
    z_statistics = (sample_mean - 0.5) / (std / math.sqrt(len(sample)))

    z_left_value = norm(loc=0, scale=1).ppf(alpha / 2)
    z_right_value = norm(loc=0, scale=1).ppf(1 - alpha / 2)
    print("z_statistics: ", round(z_statistics, 2))
    print("z_left_value: ", round(z_left_value, 2), ", z_right_value: ", round(z_right_value, 2))

    # 计算p值
    pval = norm(loc=0, scale=1).sf(abs(z_statistics)) * 2

    if z_statistics > z_right_value or z_statistics < z_left_value:
        print("reject null hypothesis, p value is: ", round(pval, 2))
    else:
        print("not reject null hypothesis, p value is: ", round(pval, 2))

运行结果：

z_statistics:  2.24
z_left_value:  -1.96 , z_right_value:  1.96
reject null hypothesis, p value is:  0.02

2. 单样本单边检验

还是以上面葡萄糖净重的例子，原假设 $H_0: \mu = 0.5 kg$ 保持不变，将备则假设修改为： $H_1: \mu > 0.5kg$ ，此时该假设检验就变成了右边检验。置信水平 $\alpha = 0.05$ 。

代码实现：

import math
import numpy as np
from scipy.stats import norm

if __name__ == '__main__':
    # 总体标准差
    std = 0.015
    # 置信水平
    alpha = 0.05
    sample = [0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512]
    # 样本均值
    sample_mean = np.mean(sample)

    # 统计量
    z_statistics = (sample_mean - 0.5) / (std / math.sqrt(len(sample)))

    z_right_value = norm(loc=0, scale=1).ppf(1 - alpha)
    print("z_statistics: ", round(z_statistics, 2))
    print("z_right_value: ", round(z_right_value, 2))

    # 计算p值
    pval = norm(loc=0, scale=1).sf(abs(z_statistics))

    if z_statistics > z_right_value:
        print("reject null hypothesis, p value is: ", round(pval, 2))
    else:
        print("not reject null hypothesis, p value is: ", round(pval, 2))

运行结果：

z_statistics:  2.24
z_right_value:  1.64
reject null hypothesis, p value is:  0.01

原文地址:https://blog.csdn.net/cl2010abc/article/details/137116924 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1777457419484532736.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

python实现假设检验-z检验

一. 什么是z检验

二. 常见z检验的实现

1. 单样本双边检验

2. 单样本单边检验

相关推荐

最近更新

热门阅读