分成四类
监督学习,非监督学习,半监督学习和增强学习
监督学习:给机器的训练数据拥有“标记”或者“答案”
监督学习:银行已经积累了一定的客户信息和他们的信用卡的
医院已经积累了一定的病人信息和他们最终确诊是否患病的情况
市场积累了房屋的基本信息和最终成交的金额
监督学习处理两大类问题:分类和回归
k近邻,线性回归和多项式回归,逻辑回归,SVM,决策树和随机森林
非监督学习 核心辅助监督学习
非监督学习:给机器的训练数据没有任何的“标记”或者答案
电商网站对于我们每一个人都是同等对待,初始的时候没有标记,但是随着我们在电商网站留下越来越多的足迹,电商网站就可以使用非监督学习的方式,为他的客户群体进行分类
可能是 理智型 或者冲动型 重视性价比,或者商品质量
对数据进行降维处理
特征提取:信用卡的信用评级和人的胖瘦无关?
特征压缩:PCA
PCA:我们并不扔掉任何的特征,但是特征关联性非常强