线性回归算法梳理

有监督：数据做过标记

无监督：对原始数据进行处理，未做标记

泛化能力：由训练数据建立的模型对同类问题的解决能力

过拟合：模型过于复杂导致解决问题能力差

欠拟合：模型过于简单导致拟合数据的能力差

(方差和偏差以及各自解决办法）

交叉验证：当数据比较少时，将数据分成n份，取n-1份做训练集，1份做验证集，改变验证集再进行训练，优化参数。

对于方差、偏差、欠拟合和过拟合可以参考：https://blog.csdn.net/hurry0808/article/details/78148756

模型：y=w1*x+w0

通过取适合的参数w1和w0，使预测值和实际值的差值最小。

损失函数：估计实际值和预测值的不一样的程度的函数

代价函数：衡量预测值和实际值之间差距的函数

目标函数：代价函数和正则项之和

优化方法是通过变更模型参数使损失函数减小的方法

梯度下降法：w1=w1-k(dL/dw)。

牛顿法：利用泰勒展开公式的前几项计算极值。

拟牛顿法：构造可以近似海森矩阵的正定对称矩阵来优化目标函数。

平均绝对误差：

均方误差：

在调用时直接import就可以了

import sklearn