决定系数(拟合优度)的相关概念
拟合优度定义近期做多元回归分析拟合工作中,在进行线性拟合时,决定系数(又称拟合优度)上不去(卡在0.3左右)一直是困扰工作进度的一个大问题。在经过多元高阶多项式和指数多项式等方法尝试后,虽有一定提高(达到0.4左右)但仍无法达到满意程度。因此开始尝试非常规的智能算法拟合。经尝试,用BP神经网络进行拟合发现拟合优度一下涨至0.7,而经改进,采用双隐含层BP神经网络算法,拟合优度更是一下提升到0.8,于是沾沾自喜,窃以为做出重大进展。但随后依次测试发现拟合优度2.3678,如遭雷劈啊。显然拟合优度应该是0到1之间,不可能超过1,于是乎一通排查。程序没问题,算法没有错。问题在哪?为寻根究底,于是乎开始重温拟合优度相关知识。并做小结以备忘。
决定系数R2(coefficient of determination),也称判定系数或者拟合优度。它是表征回归方程在多大程度上解释了因变量的变化,或者说方程对观测值的拟合程度如何。拟合优度的有效性通常要求:自变量个数:样本数>1:10。
通俗解释决定系数就是总体拟合效果的“毛”评价。为更精细判断可以采用调整决定系数、复相关系数、偏相关系数或者部分相关系数。
2 计算方法
由于新浪博文写公式不方便,采用图片格式如下
3 关于SST=SSR+SSE的简要证明
4 关于使用范围的解释
4 适用范围说明
根据回归系数的定义,以及SST=SSR+SSE的证明,决定系数适用于线性回归。根据计算公式可知其取值范围是0到1。由此可见前面BP神经网络所得出的决定系数2.3678显然是不正确的,究其原因在于神经网络所得到的的拟合模型是非线性的,不能用决定系数来评价其拟合效果。