Bootstrap

数据挖掘常用算法

基于机器学习

线性/逻辑回归

类似单层神经网络

y=k*x+b

树模型

优点

  • 可以做可视化分析
  • 速度快
  • 结果稳定

依赖前期对业务和数据的理解

贝叶斯

贝叶斯依赖先验概率,先验知识越准,结果越好

聚类

集成算法

  • xgboost
  • lightbgm

神经网络

在文本、视觉领域效果非常好。但是过程黑盒,缺乏解释性

支持向量机

降维算法

把一组特征转移到另一个特征空间。类似人的换个视角看问题。

[1*100]⊗[100*10]=[1*10]

例如评价学生成绩有语文成绩、数学成绩、英语成绩等等。使用降维算法并不是之参考一科或几科或者不参考哪科,而是通过算法对各科成绩进行综合计算,得到一组新的评价值。

;