Bootstrap

线性回归算法梳理

  • 机器学习的一些概念

有监督:数据做过标记

无监督:对原始数据进行处理,未做标记

泛化能力:由训练数据建立的模型对同类问题的解决能力

过拟合:模型过于复杂导致解决问题能力差

欠拟合:模型过于简单导致拟合数据的能力差

(方差和偏差以及各自解决办法)

 

 

交叉验证:当数据比较少时,将数据分成n份,取n-1份做训练集,1份做验证集,改变验证集再进行训练,优化参数。

对于方差、偏差、欠拟合和过拟合可以参考:https://blog.csdn.net/hurry0808/article/details/78148756 

  • 线性回归的原理

模型:y=w1*x+w0

通过取适合的参数w1和w0,使预测值和实际值的差值最小。

  • 线性回归损失函数、代价函数、目标函数

损失函数:估计实际值和预测值的不一样的程度的函数

代价函数:衡量预测值和实际值之间差距的函数

目标函数:代价函数和正则项之和

  • 优化方法(梯度下降法、牛顿法、拟牛顿法等)

优化方法是通过变更模型参数使损失函数减小的方法

梯度下降法:w1=w1-k(dL/dw)。

牛顿法:利用泰勒展开公式的前几项计算极值。

拟牛顿法:构造可以近似海森矩阵的正定对称矩阵来优化目标函数。

  • 线性回归的评估指标

平均绝对误差:

均方误差:

  •  sklearn参数详解

在调用时直接import就可以了

import sklearn

 

task1最优作业可以参考:https://github.com/trembous/homework_summary/blob/master/29-野比大雄-20190227-20190301_01.ipynb 

;