专栏介绍
1.专栏面向零基础或基础较差的机器学习入门的读者朋友,旨在利用实际代码案例和通俗化文字说明,使读者朋友快速上手机器学习及其相关知识体系。
2.专栏内容上包括数据采集、数据读写、数据预处理、分类\回归\聚类算法、可视化等技术。
3.需要强调的是,专栏仅介绍主流、初阶知识,每一技术模块都是AI研究的细分领域,同更多技术有所交叠,此处不进行讨论和分享。
- 数据采集技术:selenium/正则匹配/xpath/beautifulsoup爬虫实例
- 面向txt/json/xlsx/csv的文件读写及编码问题
- 数据预处理:统计关联性分析/数据清洗/数据增强/特征工程实例
- 一文带你入门机器学习回归算法
- 一文带你入门机器学习分类算法
——————————————————————————————————————————
——————————————————————————————————————————
概述
有监督学习和无监督学习是机器学习的两大类别,它们在数据的需求和应用的场景上有所不同。
有监督学习
(Supervised Learning)
有监督学习是指使用带有标签的数据集进行模型训练的学习方法。在训练过程中,模型会学习输入特征和输出标签之间的关系,以便能够对新的、未见过的数据进行预测。
有监督学习的显著特点:
- 需要标签数据:每个训练样本都有一个对应的标签或目标值。
- 任务类型多样:包括回归任务(预测连续值