【数学】什么是最大似然估计?如何求解最大似然估计

背景

最大似然估计(Maximum Likelihood Estimation, MLE)是一种估计统计模型参数的方法。它在众多统计学领域中被广泛使用,比如回归分析、时间序列分析、机器学习和经济学。其核心思想是:给定一个观测数据集,找到一组参数,使得在这些参数下观测到当前数据的可能性(似然)最大。

公式

假设我们有一个参数为 θ \theta θ 的概率分布,观测数据为 X = ( x 1 , x 2 , … , x n ) X = (x_1, x_2, \ldots, x_n) X=(x1,x2,,xn),则似然函数(Likelihood Function)可以表示为:
L ( θ ; X ) = P ( X ∣ θ ) = ∏ i = 1 n P ( x i ∣ θ ) L(\theta; X) = P(X|\theta) = \prod_{i=1}^n P(x_i|\theta) L(θ;X)=P(Xθ)=i=1nP(xiθ)

为了简化计算,我们通常使用对数似然函数(Log-Likelihood Function):
ℓ ( θ ; X ) = log ⁡ L ( θ ; X ) = ∑ i = 1 n log ⁡ P ( x i ∣ θ ) \ell(\theta; X) = \log L(\theta; X) = \sum_{i=1}^n \log P(x_i|\theta) (θ;X)=logL(θ;X)=i=1nlogP(xiθ)

最大似然估计的目标是找到参数 θ \theta θ,使得对数似然函数 ℓ ( θ ; X ) \ell(\theta; X) (θ;X) 达到最大值。即:
θ ^ = arg ⁡ max ⁡ θ ℓ ( θ ; X ) \hat{\theta} = \arg \max_\theta \ell(\theta; X) θ^=argθmax(θ;X)

示例题目

正态分布的概率密度函数(PDF)可以表示为:
f ( x ∣ μ , σ 2 ) = 1 2 π σ 2 exp ⁡ ( − ( x − μ ) 2 2 σ 2 ) f(x|\mu, \sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right) f(xμ,σ2)=2πσ2 1exp(2σ2(xμ)2)

假设我们有一组观测数据 X = ( x 1 , x 2 , … , x n ) X = (x_1, x_2, \ldots, x_n) X=(x1,x2,,xn),这些数据都来自于一个正态分布 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2)。我们希望估计正态分布的参数 μ \mu μ σ 2 \sigma^2 σ2
观测数据为 X = ( x 1 , x 2 , … , x n ) X = (x_1, x_2, \ldots, x_n) X=(x1,x2,,xn)

详细讲解

  1. 写出似然函数:根据正态分布的概率密度函数,似然函数可以写为:
    似然函数 L ( μ , σ 2 ; X ) L(\mu, \sigma^2; X) L(μ,σ2;X) 是在给定参数 μ \mu μ σ 2 \sigma^2 σ2 下,观测数据 X X X 出现的概率。对于独立同分布的数据,这个概率是每个数据点概率密度的乘积,即:
    L ( μ , σ 2 ; X ) = ∏ i = 1 n f ( x i ∣ μ , σ 2 ) L(\mu, \sigma^2; X) = \prod_{i=1}^n f(x_i|\mu, \sigma^2) L(μ,σ2;X)=i=1nf(xiμ,σ2)

    将正态分布的概率密度函数代入似然函数中,得到:
    L ( μ , σ 2 ; X ) = ∏ i = 1 n 1 2 π σ 2 exp ⁡ ( − ( x i − μ ) 2 2 σ 2 ) L(\mu, \sigma^2; X) = \prod_{i=1}^n \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x_i - \mu)^2}{2\sigma^2}\right) L(μ,σ2;X)=i=1n2πσ2 1exp(2σ2(xiμ)2)

对数似然函数

  1. 取对数:为了简化计算,取对数得到对数似然函数:
    ℓ ( μ , σ 2 ; X ) = ∑ i = 1 n log ⁡ ( 1 2 π σ 2 exp ⁡ ( − ( x i − μ ) 2 2 σ 2 ) ) \ell(\mu, \sigma^2; X) = \sum_{i=1}^n \log \left( \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x_i - \mu)^2}{2\sigma^2}\right) \right) (μ,σ2;X)=i=1nlog(2πσ2 1exp(2σ2(xiμ)2))
    进一步简化:
    ℓ ( μ , σ 2 ; X ) = − n 2 log ⁡ ( 2 π σ 2 ) − 1 2 σ 2 ∑ i = 1 n ( x i − μ ) 2 \ell(\mu, \sigma^2; X) = -\frac{n}{2} \log(2\pi\sigma^2) - \frac{1}{2\sigma^2} \sum_{i=1}^n (x_i - \mu)^2 (μ,σ2;X)=2nlog(2πσ2)2σ21i=1n(xiμ)2

  2. 求导并解方程:对 μ \mu μ σ 2 \sigma^2 σ2 分别求导并令其等于零,可以得到参数的估计值。
    μ \mu μ 求导:
    ∂ ℓ ∂ μ = 1 σ 2 ∑ i = 1 n ( x i − μ ) = 0 \frac{\partial \ell}{\partial \mu} = \frac{1}{\sigma^2} \sum_{i=1}^n (x_i - \mu) = 0 μ=σ21i=1n(xiμ)=0
    解得:
    μ ^ = 1 n ∑ i = 1 n x i \hat{\mu} = \frac{1}{n} \sum_{i=1}^n x_i μ^=n1i=1nxi

    σ 2 \sigma^2 σ2 求导:
    ∂ ℓ ∂ σ 2 = − n 2 σ 2 + 1 2 σ 4 ∑ i = 1 n ( x i − μ ) 2 = 0 \frac{\partial \ell}{\partial \sigma^2} = -\frac{n}{2\sigma^2} + \frac{1}{2\sigma^4} \sum_{i=1}^n (x_i - \mu)^2 = 0 σ2=2σ2n+2σ41i=1n(xiμ)2=0
    解得:
    σ ^ 2 = 1 n ∑ i = 1 n ( x i − μ ) 2 \hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \mu)^2 σ^2=n1i=1n(xiμ)2

Python代码求解

import numpy as np

# 观测数据
X = np.array([2.3, 1.9, 3.1, 2.8, 2.4])

# 估计参数
mu_hat = np.mean(X)
sigma_squared_hat = np.var(X, ddof=0)

print("估计的均值 μ:", mu_hat)
print("估计的方差 σ^2:", sigma_squared_hat)

实际生活中的例子

最大似然估计在实际生活中的应用广泛。例如,在医学研究中,科学家常常需要估计某种疾病的发病率。假设有一个新的传染病,研究人员需要估计其传播率(即,传染给某人的概率)。他们收集了若干病例数据,通过最大似然估计,可以得到传播率的最优估计,从而帮助制定防控策略。

最大似然估计同样可以应用于金融领域,比如估计股票的收益率和风险;在机器学习中,用于训练模型的参数,如线性回归中的回归系数等。

相关推荐

  1. 估计(通俗讲解)

    2024-06-16 02:24:02       27 阅读
  2. python统计学-矩估计法、极大估计法?

    2024-06-16 02:24:02       58 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-16 02:24:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-16 02:24:02       100 阅读
  3. 在Django里面运行非项目文件

    2024-06-16 02:24:02       82 阅读
  4. Python语言-面向对象

    2024-06-16 02:24:02       91 阅读

热门阅读

  1. 力扣-1953

    2024-06-16 02:24:02       27 阅读
  2. 乐观锁和悲观锁

    2024-06-16 02:24:02       34 阅读
  3. Spring框架的原理及应用详解(四)

    2024-06-16 02:24:02       22 阅读
  4. 2024.6.15

    2024-06-16 02:24:02       35 阅读
  5. 【LeetCode 5.】 最长回文子串

    2024-06-16 02:24:02       29 阅读
  6. Mac的m系列芯片安装虚拟机--简单流程

    2024-06-16 02:24:02       30 阅读