【统计】什么事 R 方

将线性模型拟合到时间序列时,通常使用最小二乘法在模型 y ^ ( t ) = a + b t \hat{y}(t) = a + bt y^(t)=a+bt中找到系数 a a a b b b,其中 y ^ ( t ) \hat{y}(t) y^(t)是时间 t t t的预测值,而的观测值是 y ( t ) y(t) y(t)

残差平方和又称误差平方和(SSE),计算公式为:

S S E = ∑ i = 1 n ( y i − y ^ i ) 2 SSE = \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 SSE=i=1n(yiy^i)2

其中 y i y_i yi i i i时刻的观测值, y ^ i \hat{y}_i y^i i i i时刻的预测值, n n n为观测数。

为了使其规范化,可以将SSE除以表示原始数据可变性的度量。一种常见的选择是使用总平方和(SST),它测量数据集中的总方差:

S S T = ∑ i = 1 n ( y i − y ˉ ) 2 SST = \sum_{i=1}^{n} (y_i - \bar{y})^2 SST=i=1n(yiyˉ)2

其中 y ˉ \bar{y} yˉ为观测值的平均值。

然后,可以计算决定系数,也称为 R 2 R^2 R2,这是一个指标,表明因变量中方差的比例,可以从自变量预测:

R 2 = 1 − S S E S S T R^2 = 1 - \frac{SSE}{SST} R2=1SSTSSE

R 2 R^2 R2范围从0到1,其中接近1的值表明该模型解释了结果变量的大部分方差,表明更线性的关系。

然而,如果想要一个专门衡量非线性的指标,可以考虑使用以下规范化值:

N L = S S E S S T = 1 − R 2 NL = \frac{SSE}{SST} = 1 - R^2 NL=SSTSSE=1R2

对于被线性趋势很好地近似的时间序列,这种归一化线性度量(NL)将接近于0,对于不被线性趋势很好地近似的时间序列,这种归一化线性度量(NL)将接近于1。

如果不考虑模型和数据的上下文,使用 R 2 R^2 R2 N L NL NL可能会产生误导。它们没有表明回归量是否与结果变量有因果关系,也没有表明模型是否是备选方案中最好的。查看残差并执行其他诊断检查以确保模型的适当性总是很重要的。

相关推荐

  1. 统计什么 R

    2024-03-30 09:40:06       40 阅读
  2. 统计什么 KPSS 检验

    2024-03-30 09:40:06       47 阅读
  3. 什么阶段做什么

    2024-03-30 09:40:06       57 阅读
  4. R_handbook_统计分析

    2024-03-30 09:40:06       43 阅读
  5. R语言:卡检验

    2024-03-30 09:40:06       31 阅读
  6. 差是什么

    2024-03-30 09:40:06       25 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-30 09:40:06       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-30 09:40:06       106 阅读
  3. 在Django里面运行非项目文件

    2024-03-30 09:40:06       87 阅读
  4. Python语言-面向对象

    2024-03-30 09:40:06       96 阅读

热门阅读

  1. 机器学习概念、步骤、分类和实践

    2024-03-30 09:40:06       40 阅读
  2. openGauss JDBC客户端负载均衡与读写分离

    2024-03-30 09:40:06       38 阅读
  3. 文件系统知识内容详解

    2024-03-30 09:40:06       40 阅读
  4. TDengine 使用爬坑

    2024-03-30 09:40:06       38 阅读