做数据分析为何要学统计学(3)——何为置信区间?它有什么作用?

置信区间是统计学中的一个重要工具,用以使用样本参数(\bar u ,\sigma)来估计总体均值在某置信水平下的范围。通俗一点讲,如果置信度为95%(等价于显著水平a=0.05),置信区间为[a,b],这就意味着总体均值落入该区间的概率为95%。

一般情况下当我们抽样的数量大于等于30时,可认为样本均值服从正态分布,以此我们通过查标准正态分布表,或者显著水平a下的z值,然后即可获得置信区间。如下

[\bar u-\frac{|z_a|}{\sqrt n}*\sigma ,\bar u+\frac{|z_a|}{\sqrt n}*\sigma]

 如果样本数量小于30,则查t分布表,确定置信区间。

比如工厂要确定95%置信水平下的产品成份含量的置信区间,但手里只有20个样本数据,如何来估计总体的成分含量呢?我们可以对这20个样本数据进行30轮重复采样,每次随机采样10件产品,记录其均值。这样会得到30个样本均值。根据中心极限定理,这30个样本服从正态分布,于是我们就可以用这30个样本均值的均值及标准差,来估计总体的成分含量区间了。

 示例代码如下:

#初始化样本
X=np.array([91,94,91,94,97,83,91,95,94,96,97,95,90,91,95,91,88,85,89,93])

#样本排序,为了适应下面的随机抽样函数
X=sorted(X)

#使用random模块的随机抽样函数sample,进行抽样。该函数有两个参数,第一个是样本集合,第二个是抽取数量
import random

#进行30轮随机抽样同时计算均值,形成新的正态分布的样本
n=30
X_new=[np.mean(random.sample(X, 10)) for i in range(n)]
X_new

#计算样本均值和标准差
mu,std=np.mean(X_new),np.std(X_new)
mu,std

#求置信区间
[mu-std/np.sqrt(n)*1.96,mu+std/np.sqrt(n)*1.96]

最终估计的总体均值置信区间为[91.69440711928762, 92.17892621404569]。

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-12 05:34:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-12 05:34:02       100 阅读
  3. 在Django里面运行非项目文件

    2023-12-12 05:34:02       82 阅读
  4. Python语言-面向对象

    2023-12-12 05:34:02       91 阅读

热门阅读

  1. 猜数字游戏的Python实现

    2023-12-12 05:34:02       55 阅读
  2. Vue3源码梳理:设计一个微型Vue的源码框架环境

    2023-12-12 05:34:02       63 阅读
  3. [go 面试] 缓存策略与应对数据库压力的良方

    2023-12-12 05:34:02       69 阅读
  4. 宏定义控制printf

    2023-12-12 05:34:02       63 阅读
  5. Matlab窄带信号的测向算法

    2023-12-12 05:34:02       59 阅读
  6. 12.11

    12.11

    2023-12-12 05:34:02      58 阅读
  7. 【力扣100】238.除自身以外数组的乘积

    2023-12-12 05:34:02       64 阅读
  8. IoTDB服务安装教程-单机版

    2023-12-12 05:34:02       46 阅读
  9. Redis研学-三种特殊类型的常用命令

    2023-12-12 05:34:02       63 阅读
  10. js中严格模式简单介绍

    2023-12-12 05:34:02       53 阅读
  11. 特征工程之特征选择 - Python

    2023-12-12 05:34:02       46 阅读
  12. 32、卷积参数 - 长宽方向的公式推导

    2023-12-12 05:34:02       58 阅读
  13. 聊聊 Jetpack Compose 原理 -- 穿透刺客 CompositionLocal

    2023-12-12 05:34:02       44 阅读
  14. 前端知识(十二)———ES6迭代器

    2023-12-12 05:34:02       56 阅读
  15. 基于鲸鱼算法求解多目标优化问题附 MATLAB 代码

    2023-12-12 05:34:02       57 阅读