- 机器学习的一些概念
有监督:数据做过标记
无监督:对原始数据进行处理,未做标记
泛化能力:由训练数据建立的模型对同类问题的解决能力
过拟合:模型过于复杂导致解决问题能力差
欠拟合:模型过于简单导致拟合数据的能力差
(方差和偏差以及各自解决办法)
交叉验证:当数据比较少时,将数据分成n份,取n-1份做训练集,1份做验证集,改变验证集再进行训练,优化参数。
对于方差、偏差、欠拟合和过拟合可以参考:https://blog.csdn.net/hurry0808/article/details/78148756
- 线性回归的原理
模型:y=w1*x+w0
通过取适合的参数w1和w0,使预测值和实际值的差值最小。
- 线性回归损失函数、代价函数、目标函数
损失函数:估计实际值和预测值的不一样的程度的函数
代价函数:衡量预测值和实际值之间差距的函数
目标函数:代价函数和正则项之和
- 优化方法(梯度下降法、牛顿法、拟牛顿法等)
优化方法是通过变更模型参数使损失函数减小的方法
梯度下降法:w1=w1-k(dL/dw)。
牛顿法:利用泰勒展开公式的前几项计算极值。
拟牛顿法:构造可以近似海森矩阵的正定对称矩阵来优化目标函数。
- 线性回归的评估指标
平均绝对误差:
均方误差:
- sklearn参数详解
在调用时直接import就可以了
import sklearn
task1最优作业可以参考:https://github.com/trembous/homework_summary/blob/master/29-野比大雄-20190227-20190301_01.ipynb