参考资料:生物统计学
1、回归方程的评价
通过对回归方程的假设检验,如果显著(或极显著),说明x、y两变量间存在一定的直线关系,但不能明确两者直线关系的密切程度。为说明变量间的回归关系的密切程度,可从拟合度和偏离度两个方面对回归方程进行评价。
(1)回归方程的拟合度
建立回归方程的过程称为拟合。如果资料中各散点的分布紧密围绕于所建立的回归直线附近,说明两变量之间的直线关系紧密,所建立的回归方程的拟合度好;反之,拟合度差。统计学上使用决定系数来评价回归方程拟合度的好坏。决定系数定义为回归平方和占(因变量)总平方和的比例,理解为回归关系引起的变异,计算公式为:
,即决定系数的取值范围为[0,1]。
(2)回归方程的偏离度
离回归均方MSe是回归模型中σ^2的估计值。离回归均方的算术根称为离回归标准误,如下:
离回归标准误表示回归估计值与实际观测值偏差的程度。统计学上使用离回归标准误来度量回归方程的偏离度。
2、回归方程的应用
(1)预测
建立回归方程的目的是研究因变量随自变量变化的过程,并预测自变量不同取值时因变量的变化。预测时只需将自变量的取值带入回归方程,就可计算出因变量的取值。
(2)控制
质量标准要求产品的某项质量指标y在一定范围内取值,否则产品被视为不合格。为保证因变量y在区间(y1,y2)内取值,需要对自变量x的取值进行控制。由因变量y反推自变量x的取值范围的问题,称为控制问题。
控制是预测的反问题,即以P=1-α的置信度求出区间(x1,x2),当x在(x1,x2)内取值时,观察值y落在(y1,y2)内。
实际应用中常用单个观察值的预测区间进行反向求解,解出x1、x2来,即为P=1-α置信度控制区间的自变量x取值的上下限。
(3)校正
生物机能指标(如呼吸强度)的测定通常要求在一定的条件下(如20℃)进行。因为在不同条件下这类指标会发生较大变化,而野外调查或田间试验时又很难保证在标准条件下进行测量。为解决这类问题,可测定同一试验材料在不同条件下(如不同温度)的指标变化,建立回归方程,弄清试验指标与试验条件的关系,通过回归关系对测定结果进行校正。