机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。
这门课中,我们主要讲解经典的机器学习算法,如线性回归、逻辑回归、决策树等,也将讲解近几年才出现的如XGBoost、LightGBM等集成学习算法。此外,这门课还会讲解利用机器学习解决问题的实用技术,还包括Python、Scikit-learn工具的使用等等。
通过这门课,学习者将初步理解主流的机器学习算法,并且可以用机器学习技术解决现实生活中的问题。
与国内外很多非常优秀的机器学习课程或作品相比(如吴恩达机器学习课程、李航老师的统计学习方法、周志华老师的《机器学习》等),本课程对初学者来说,属于“雪中送炭”,而不是“锦上添花”,更适合初学者学习,主要解决初学者的三个问题:就是资料太多,难以取舍;理论性强,初学比较困难; 代码资料比较少。只要有本科三年级以上的数学知识,会一种编程语言,就可以掌握这门课程的绝大部分内容。
1、掌握机器学习的基本问题定义、基本模型,对机器学习学科有概览性的认识。
2、掌握目前主流的机器学习算法和模型,并能够根据实际问题的需要选择并实现相应的算法。
3、编程完成机器学习典型应用实例,对机器学习工程编程有初步的训练。
引言
机器学习概述
机器学习的类型
机器学习的背景知识
机器学习的开发流程
课程复习资料
引言课后测试
回归
线性回归
梯度下降
正则化
回归的评价指标
回归代码
回归课后测试
逻辑回归
分类问题
Sigmoid函数
逻辑回归求解
逻辑回归的代码实现
逻辑回归代码
逻辑回归课后测验
朴素贝叶斯
贝叶斯方法
朴素贝叶斯原理
朴素贝叶斯案例
朴素贝叶斯代码实现
朴素贝叶斯代码
朴素贝叶斯课后测验
机器学习实践
数据集划分
评价指标
正则化、偏差和方差
机器学习实践课后测验
机器学习库Scikit-learn
机器学习库Scikit-learn概述
Scikit-learn的主要用法
Scikit-learn的使用案例
机器学习实践资源
KNN算法
距离度量
KNN算法
KD树划分
KD树搜索
KNN算法代码
KNN算法课后测验
决策树
决策树原理
ID3算法
C4.5算法
CART算法
决策树算法代码
决策树课后测验
集成学习
集成学习方法概述
AdaBoost和GBDT算法
XGBoost算法
LightGBM算法
集成学习代码实现
集成学习代码
集成学习课后测验
人工神经网络
人工神经网络发展历史
感知机算法
反向传播算法(BP算法)
人工神经网络课后代码
人工神经网络课后测验
支持向量机
支持向量机概述
线性可分支持向量机
线性支持向量机
线性不可分支持向量机
支持向量机代码实现
支持向量机代码
支持向量机课后测验
聚类
无监督学习概述
K-means聚类
密度聚类和层次聚类
聚类的评价指标
聚类代码
聚类课后测验
降维
降维概述
SVD(奇异值分解)
PCA(主成分分析)
降维代码
降维课后测验
关联规则
关联规则概述
Apriori 算法
FP-Growth算法
关联规则课后代码
关联规则课后测验
机器学习项目流程
机器学习项目流程概述
数据清洗
特征工程
数据建模
调参练习
机器学习项目流程代码
数学基础:主要包括高等数学、线性代数、概率论与数理统计。
编程基础:已经掌握一种编程工具,会使用Python进行简单地编程。
参考书:
参考网络资源:
Q : 课程的有配套教材吗?
A : 课程的配套教材为:
机器学习入门基础(微课版),黄海广,徐震,张笑钦,清华大学出版社,2023,ISBN:9787302619581
Q : 课程的资源可以下载吗?
A : 课程的代码和ppt(pdf版本),都可以在Github:https://github.com/fengdu78/WZU-machine-learning-course 下载。
Q : 教师可以下载原版的ppt文件吗?
A : 教师请用edu邮箱发邮件给黄海广老师:haiguang2000@wzu.edu.cn,说明姓名,学校,即可收到原版ppt文件。