关于样本方差的分母是 ( n-1 ) 而不是 ( n )的原因

样本方差的分母是 ( n-1 ) 而不是 ( n ) 的原因与统计学中的“自由度”概念有关。使用 ( n-1 ) 作为分母可以使样本方差成为总体方差的无偏估计量。

自由度

在计算样本方差时,我们需要先计算样本均值 ( \bar{x} )。样本中的 ( n ) 个数据点中,实际上只有 ( n-1 ) 个数据点是自由变化的,因为最后一个数据点可以通过样本均值和前面的 ( n-1 ) 个数据点确定。因此,我们说在计算样本方差时,有 ( n-1 ) 个自由度。

无偏估计

如果我们使用 ( n ) 作为分母来计算样本方差:

s n 2 = 1 n ∑ i = 1 n ( x i − x ˉ ) 2 s_n^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2 sn2=n1i=1n(xixˉ)2

这个估计量会系统性地低估总体方差 ( \sigma^2 )。这是因为在计算样本方差时,样本均值 ( \bar{x} ) 是根据样本数据计算出来的,这使得每个样本数据点 ( x_i ) 与 ( \bar{x} ) 的差异小于它们与总体均值 ( \mu ) 的差异。

为了纠正这种偏差,我们使用 ( n-1 ) 作为分母来计算样本方差:

s 2 = 1 n − 1 ∑ i = 1 n ( x i − x ˉ ) 2 s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2 s2=n11i=1n(xixˉ)2

这种调整使得样本方差成为总体方差的无偏估计量。这意味着在大量重复抽样的情况下,样本方差的期望值等于总体方差。

数学证明

为了证明这种调整的合理性,我们可以用期望值的概念进行解释。令样本方差的计算公式为:

s 2 = 1 n − 1 ∑ i = 1 n ( x i − x ˉ ) 2 s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2 s2=n11i=1n(xixˉ)2

然后考虑它的期望值:

E [ s 2 ] = E [ 1 n − 1 ∑ i = 1 n ( x i − x ˉ ) 2 ] E[s^2] = E\left[\frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2\right] E[s2]=E[n11i=1n(xixˉ)2]

经过数学推导,可以证明:

E [ s 2 ] = σ 2 E[s^2] = \sigma^2 E[s2]=σ2

这表明使用 ( n-1 ) 作为分母能使样本方差的期望值等于总体方差,从而使样本方差成为总体方差的无偏估计量。

最近更新

  1. TCP协议是安全的吗?

    2024-06-11 09:40:04       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-11 09:40:04       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-11 09:40:04       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-11 09:40:04       20 阅读

热门阅读

  1. YOLOv10、YOLOv9 和 YOLOv8 在实际视频中的对比

    2024-06-11 09:40:04       8 阅读
  2. Python中使用SQLite和SQLAlchemy

    2024-06-11 09:40:04       9 阅读
  3. 如何用visual studio 2022创建MAUI的Hello world程序

    2024-06-11 09:40:04       6 阅读
  4. 使用docker部署在MacOS上部署minecraft服务器

    2024-06-11 09:40:04       8 阅读
  5. VB.net调用VC DLL

    2024-06-11 09:40:04       10 阅读
  6. 程序员如何高效挖掘市场需求

    2024-06-11 09:40:04       9 阅读
  7. MyEclipse 新手使用教程

    2024-06-11 09:40:04       11 阅读
  8. adb 脚本化Android系统截图和录屏

    2024-06-11 09:40:04       8 阅读
  9. 记一次大量CSV数据文件同步到数据库

    2024-06-11 09:40:04       7 阅读
  10. go_compiler

    2024-06-11 09:40:04       4 阅读
  11. 平均召回(Average Recall,AR)概述

    2024-06-11 09:40:04       11 阅读