数据挖掘与python实践
分享
课程详情
课程评价
spContent=身处数据时代,如何在“数据爆炸但知识缺乏”的社会中沙里淘金。数据挖掘作为一门交叉学科,融合了算法、数据库、统计学、信息技术等诸多知识,不仅提供了很好的解决思路,也是有力的科研工具和人工智能发展的重要基础。思维上对数据敏感、实践中熟练掌握工具已经成为了当代数据分析人才的必备素质。
—— 课程团队
课程概述

数据挖掘与Python实践》课程主要讲授数据挖掘的基本理论、各个分支及应用。课程涵盖DM的定义、流程、数据预处理、数据可视化、关联分析、聚类、分类、数值预测等内容。通过课程学习,你将会掌握数据挖掘的基本理论、思想和方法,并通过简单易用的软件来解决相关的问题。



授课目标

1.  了解和掌握数据挖掘的基本理论、流程和方法。

2.  了解和掌握数据挖掘过程过中的技术,如数据预处理、数据可视化、关联分析、聚类、分类、数值预测等内容。

3.  通过课程学习,能通过简单易用的软件来解决数据挖掘的相关问题


课程大纲
预备知识
  1. 数理统计

  2. 高等代数

证书要求

为积极响应国家低碳环保政策, 2021年秋季学期开始,中国大学MOOC平台将取消纸质版的认证证书,仅提供电子版的认证证书服务,证书申请方式和流程不变。

 

电子版认证证书支持查询验证,可通过扫描证书上的二维码进行有效性查询,或者访问 http://www.icourse163.org/verify,通过证书编号进行查询。学生可在“个人中心-证书-查看证书”页面自行下载、打印电子版认证证书。

 

完成课程教学内容学习和考核,成绩达到课程考核标准的学生(每门课程的考核标准不同,详见课程内的评分标准),具备申请认证证书资格,可在证书申请开放期间(以申请页面显示的时间为准),完成在线付费申请。

 

认证证书申请注意事项:

1. 根据国家相关法律法规要求,认证证书申请时要求进行实名认证,请保证所提交的实名认证信息真实完整有效。

2. 完成实名认证并支付后,系统将自动生成并发送电子版认证证书。电子版认证证书生成后不支持退费。


参考资料

1.  《数据挖掘:概念与技术》.韩家炜.(第三版). 北京:机械工业出版社,2012.

2.  《商务智能》,刘红岩.北京:清华大学出版社,2013.

3.  《机器学习》,周志华. 北京:清华大学出版社,2016.

4.  《统计学习方法》,李航. 北京:清华大学出版社,2019.

5.  《Python for Data Analysis》,Wes McKinney. O'Reilly Media, 2019.

6.  《利用Python进行数据分析》,徐敬一(译), 北京:机械工业出版社,2018.



常见问题

1.课程各单元的发布时间是什么时候?

   课程教学和发布安排一般是每个单元为一周,个别单元为两周,具体时间如表所示。


单元单元内容发布时间
第一单元导言2022/3/2    10:00:00
第二单元认识数据2022/3/9   10:00:00
第三单元数据预处理2022/3/23  10:00:00
第四单元关联规则挖掘2022/3/30 10:00:00
第五单元分类2022/4/13 10:00:00
第六单元数值预测2022/4/27    10:00:00
第七单元聚类分析2022/5/4  10:00:00
第八单元复杂数据的挖掘2022/5/18  10:00:00


2.每章测试和期末测试在什么时间?

   每章测试在每章课程教学发布之后,期末测试在课程结束后一周,2022年3月2号开始-2022年6月15号结束。