spContent=数据挖掘是近十几年来大数据、人工智能行业飞速发展最重要的驱动技术之一,当前大数据分析几乎都离不开数据挖掘技术,因此掌握数据挖掘的相关知识技能对于学生当下就业和未来深造都有重要意义。 本课程面向计算机、管理科学与工程、系统工程相关专业高年级本科生或低年级研究生,课程深入数据挖掘技术基础,紧跟数据科学前沿,使得学生既能够掌握数据挖掘算法的基本原理、关键技术,又使学生知道如何使用数据。此外,课程引入最新的数据挖掘案例,使得学生掌握如何通过了解数据、数据预处理、数据模式挖掘来解决现实中的数据挖掘案例。教学内容的组织与实施上,使用片段式的教学,每个知识点为一个教学片段,每个片段时长为10-25分钟。教学内容尤其是教学视频的制作上,运用信息技术将教师授课场景、ppt、动画、视频等实现动态最优组合合成,并采用视频交互模式实现,提高视觉效果和学习体验。
数据挖掘是近十几年来大数据、人工智能行业飞速发展最重要的驱动技术之一,当前大数据分析几乎都离不开数据挖掘技术,因此掌握数据挖掘的相关知识技能对于学生当下就业和未来深造都有重要意义。 本课程面向计算机、管理科学与工程、系统工程相关专业高年级本科生或低年级研究生,课程深入数据挖掘技术基础,紧跟数据科学前沿,使得学生既能够掌握数据挖掘算法的基本原理、关键技术,又使学生知道如何使用数据。此外,课程引入最新的数据挖掘案例,使得学生掌握如何通过了解数据、数据预处理、数据模式挖掘来解决现实中的数据挖掘案例。教学内容的组织与实施上,使用片段式的教学,每个知识点为一个教学片段,每个片段时长为10-25分钟。教学内容尤其是教学视频的制作上,运用信息技术将教师授课场景、ppt、动画、视频等实现动态最优组合合成,并采用视频交互模式实现,提高视觉效果和学习体验。
—— 课程团队
课程概述
1.数据挖掘是近十几年来大数据、人工智能行业飞速发展最重要的驱动技术之一,当前大数据分析几乎都离不开数据挖掘技术,应用广泛,是业界所需;
2.数据挖掘集合了概率统计、机器学习、人工智能、数据可视化、算法等等多门计算机领域核心知识,是信息技术研究的重要领域;
3.掌握数据挖掘的相关知识技能对于学生当下就业和未来深造都有重要意义。
1.认识数据的统计特性,了解数据的可视化方法,把握数据相似性计算;
2.掌握数据预处理的四大步骤及方法;
3.掌握分类、聚类、回归、关联规则挖掘等核心技术;
4.了解具体数据挖掘的处理过程。
1.紧跟技术前沿,内容涉及最新的业界技术和前沿研究;
2.注重技术实践,将经典案例融入到数据挖掘课程教学中,提高课程学以致用的效果;
3.重视基础知识,将数据挖掘知识与概率统计、机器学习、算法等底层核心知识融会贯通。
成绩 要求
为积极响应国家低碳环保政策, 2021年秋季学期开始,中国大学MOOC平台将取消纸质版的认证证书,仅提供电子版的认证证书服务,证书申请方式和流程不变。
电子版认证证书支持查询验证,可通过扫描证书上的二维码进行有效性查询,或者访问 https://www.icourse163.org/verify,通过证书编号进行查询。学生可在“个人中心-证书-查看证书”页面自行下载、打印电子版认证证书。
完成课程教学内容学习和考核,成绩达到课程考核标准的学生(每门课程的考核标准不同,详见课程内的评分标准),具备申请认证证书资格,可在证书申请开放期间(以申请页面显示的时间为准),完成在线付费申请。
认证证书申请注意事项:
1. 根据国家相关法律法规要求,认证证书申请时要求进行实名认证,请保证所提交的实名认证信息真实完整有效。
2. 完成实名认证并支付后,系统将自动生成并发送电子版认证证书。电子版认证证书生成后不支持退费。
课程大纲
认识数据
2.1 数据类型和统计
2.2 数据可视化
2.3 数据相似性
2.4 章节测试
数据预处理
3.1 数据清洗
3.2 数据集成
3.3 数据规约
3.4 数据转换
3.5 章节测试
贝叶斯分类
4.1 贝叶斯分类基本概念
4.2 贝叶斯分类案例
4.3 章节测试
决策树分类
5.1 决策树基本概念
5.2 决策树构建方法
5.3 决策树分类案例
5.4 章节测试
k-均值聚类
6.1 k-均值聚类基本方法
6.2 k-均值聚类案例
6.3 章节测试
逻辑回归
7.1 逻辑回归基本原理
7.2 逻辑回归正则化
7.3 章节测试
关联规则挖掘
8.1 关联规则挖掘概念与基本算法
8.2 Apriori算法
8.3 FPGrowth算法
8.4 规则挖掘
8.5 章节测试
数据挖掘实践
9.1 初始数据挖掘实践
9.1.1 分类实践任务起点
9.1.2 初始数据之特征选择
9.2 数据预处理实践
9.2.1 数据预处理之清洗
9.2.2 数据预处理之转换
9.2.3 数据预处理之降维
9.3 数据挖掘基础算法实践
9.3.1 回归预测实践
9.3.2 数值预测时间特征扩展实践
9.3.3 不平衡分类实践
9.3.4 聚类算法实践
9.3.5 KNN 分类实践
9.4 章节测试
支持向量机分类
10.1 支持向量机数学原理
10.2 支持向量机扩展
10.3 章节测试
神经网络分类
11.1 神经网络基础概念
11.2 神经网络数学原理
11.3 章节测试
集成学习
12.1 Bagging分类
12.2 随机森林分类
12.3.1 Boosting分类基础
12.3.2 Boosting分类理论
12.4 GBDT学习
12.5 章节测试
展开全部