hi,小慕
课程

中国大学MOOC,为你提供一流的大学教育

认证学习
为你提供认证成绩和证书,以及AI高效学习服务
查看详情
大学

国家精品

认证学习

智慧课程

理学工学农学

计算机

经济管理

外语

音乐与艺术

心理学

文史哲法

医学与保健

教育教学

大学生竞赛

软件实训

人工智能

升学/择业

考研

期末突击

专升本

四六级

保研及论文

求职就业

专四专八

大学应试英语

期末资料

终身学习

有声课堂

兴趣技能

hi,小mooc
期末不挂科
数据挖掘与python实践
第10次开课
开课时间: 2024年09月02日 ~ 2024年12月31日
学时安排: 3-5
当前开课已结束 已有 1448 人参加
老师已关闭该学期,无法查看
课程详情
课程评价(22)
spContent=身处数据时代,如何在“数据爆炸但知识缺乏”的社会中沙里淘金。数据挖掘作为一门交叉学科,融合了算法、数据库、统计学、信息技术等诸多知识,不仅提供了很好的解决思路,也是有力的科研工具和人工智能发展的重要基础。思维上对数据敏感、实践中熟练掌握工具已经成为了当代数据分析人才的必备素质。
身处数据时代,如何在“数据爆炸但知识缺乏”的社会中沙里淘金。数据挖掘作为一门交叉学科,融合了算法、数据库、统计学、信息技术等诸多知识,不仅提供了很好的解决思路,也是有力的科研工具和人工智能发展的重要基础。思维上对数据敏感、实践中熟练掌握工具已经成为了当代数据分析人才的必备素质。
—— 课程团队
课程概述


数据挖掘与Python实践》课程主要讲授数据挖掘的基本理论、各个分支及应用。课程涵盖DM的定义、流程、数据预处理、数据可视化、关联分析、聚类、分类、数值预测等内容。通过课程学习,你将会掌握数据挖掘的基本理论、思想和方法,并通过简单易用的软件来解决相关的问题。

授课目标

1. 了解和掌握数据挖掘的基本理论、流程和方法。

2. 了解和掌握数据挖掘过程过中的技术,如数据预处理、数据可视化、关联分析、聚类、分类、数值预测等内容。

3. 通过课程学习,能通过简单易用的软件来解决数据挖掘的相关问题。

课程大纲
导言
课时目标:理解数据挖掘的定义、流程和相关应用场景。
1.1数据挖据的产生、定义和流程
1.2数据挖掘的方法
1.3数据挖掘的应用
1.4python介绍
认识数据
课时目标:理解数据的不同类型,掌握数据的基本描述性统计、可视化作图、以及相似性分析。
2.1数据对象与属性类型
2.2数据的基本统计描述
2.3数据可视化
2.4数据的相似性与相异性度量
2.5python操作:认识数据(一)
2.6python操作:认识数据(二)
数据预处理
课时目标:理解数据预处理的原因,掌握数据预处理的不同方法。
3.1数据预处理的基本思想和数据规范化
3.2数据离散化
3.3数据清洗
3.4特征提取与特征选择
关联规则挖掘
课时目标:理解关联分析的定义,掌握关联规则挖掘的方法和应用。
4.1引言
4.2频繁模式与关联规则
4.3频繁项集的典型挖掘方法
4.4关联规则的生成方法
4.5关联规则的其他类型
4.6关联规则的兴趣度的其他度量
4.7python操作:关联规则挖掘
分类
课时目标:理解分类的定义、流程和评价,掌握几种不同分类的方法和应用。
5.1分类的概念
5.2决策树分类
5.3朴素贝叶斯分类
5.4k近邻分类
5.5分类性能的度量方法
5.6python操作:分类(一)
5.7python操作:分类(二)
数值预测
课时目标:理解数值预测的定义、流程和评价,掌握几种不同数值预测的方法和应用。
6.1数值预测概念
6.2回归方法
6.3 回归树与模型树
6.4K近邻数值预测和预测误差的度量
6.5python操作:数值预测
聚类分析
课时目标:理解聚类分析的定义、流程和评价,掌握聚类分析的方法和应用。
7.1概述
7.2相似度度量方法
7.3 k均值聚类法
7.4 层次聚类方法
7.5 DBSCAN方法
7.6 聚类效果衡量方法
7.7python操作:聚类分析(一)
7.8python操作:聚类分析(二)
复杂数据的挖掘
课时目标:理解复杂数据挖掘的应用场景。
8.1挖掘复杂的数据类型-序列与网络
8.2挖掘复杂的数据类型-其他类型
展开全部
预备知识

1.数理统计

2.高等代数

证书要求

为积极响应国家低碳环保政策, 2021年秋季学期开始,中国大学MOOC平台将取消纸质版的认证证书,仅提供电子版的认证证书服务,证书申请方式和流程不变。

 

电子版认证证书支持查询验证,可通过扫描证书上的二维码进行有效性查询,或者访问 https://www.icourse163.org/verify,通过证书编号进行查询。学生可在“个人中心-证书-查看证书”页面自行下载、打印电子版认证证书。

 

完成课程教学内容学习和考核,成绩达到课程考核标准的学生(每门课程的考核标准不同,详见课程内的评分标准),具备申请认证证书资格,可在证书申请开放期间(以申请页面显示的时间为准),完成在线付费申请。

 

认证证书申请注意事项:

1. 根据国家相关法律法规要求,认证证书申请时要求进行实名认证,请保证所提交的实名认证信息真实完整有效。

2. 完成实名认证并支付后,系统将自动生成并发送电子版认证证书。电子版认证证书生成后不支持退费。


参考资料


1.  《数据挖掘与Python实践》 李爱华. 孟凡. 北京:高等教育出版社,2023.

2. 《数据挖掘:概念与技术》 韩家炜.(第三版). 北京:机械工业出版社,2012.

3. 《商务智能》 刘红岩.北京:清华大学出版社,2013.

4. 《机器学习》 周志华. 北京:清华大学出版社,2016.

5. 《统计学习方法》 李航. 北京:清华大学出版社,2019.

6. 《Python for Data Analysis》 Wes McKinney. O'Reilly Media, 2019.

7. 《利用Python进行数据分析》 徐敬一(译). 北京:机械工业出版社,2018.


常见问题

1.课程各单元的发布时间是什么时候?

  课程教学和发布安排一般是每个单元为一周,个别单元为两周,具体时间如表所示。

 

单元      单元内容      发布时间

第一单元      导言      2024/9/2 10:00

第二单元      认识数据      2024/9/9 10:00

第三单元      数据预处理   2024/9/16 10:00

第四单元      关联规则挖掘      2024/9/23 10:00

第五单元      分类      2024/10/7 10:00

第六单元      数值预测      2024/10/21 10:00

第七单元      聚类分析      2024/10/28 10:00

第八单元      复杂数据的挖掘   2024/11/11 10:00

 

2.每章测试和期末测试在什么时间?

  每章测试在每章课程教学发布之后,期末测试在课程结束后一周,2024年9月2号开始-2024年12月31号结束。

中央财经大学
5 位授课老师
李爱华

李爱华

教授

孟凡

孟凡

讲师

宿洁

宿洁

副教授

推荐课程

下载
下载

下载App