hi,小慕
课程

中国大学MOOC,为你提供一流的大学教育

hi,小mooc
数据挖掘技术及应用
第1次开课
开课时间: 2025年02月24日 ~ 2025年07月07日
学时安排: 5小时每周
进行至第11周,共20周 已有 174 人参加
立即参加
课程详情
课程评价
spContent=将带你踏上一场精彩的数据探索之旅,全方位解锁数据挖掘与可视化的奥秘,成为数据领域的行家里手。 1. 系统化的知识体系 从数据挖掘的基础概念讲起,深入浅出地讲解数据挖掘的定义、核心思想、相关术语,带你构建完整的知识框架。 2. 实战导向的教学模式 课程以真实案例贯穿始终,带你深入阿里天池 AI 实训平台,亲身体验数据挖掘的全过程。从数据采集、预处理,到模型搭建与优化,每一步都有详细的操作指导和实战演练。 3. 全面覆盖的可视化技术 将详细讲解普通数据、多维数据以及专门领域数据的可视化技术,帮助你掌握多种可视化工具和方法,让你能够根据不同的数据类型和需求,快速生成直观、易懂的可视化图表,让数据“说话”。 4. 多算法对比与模型优化 将带你训练多种现存算法模型,并从多个角度进行对比分析。通过对比,你将深入了解不同算法的优缺点,掌握模型优化的技巧,从而能够根据实际问题灵活选择和优化算法模型,提升数据挖掘的准确性和效率。
将带你踏上一场精彩的数据探索之旅,全方位解锁数据挖掘与可视化的奥秘,成为数据领域的行家里手。 1. 系统化的知识体系 从数据挖掘的基础概念讲起,深入浅出地讲解数据挖掘的定义、核心思想、相关术语,带你构建完整的知识框架。 2. 实战导向的教学模式 课程以真实案例贯穿始终,带你深入阿里天池 AI 实训平台,亲身体验数据挖掘的全过程。从数据采集、预处理,到模型搭建与优化,每一步都有详细的操作指导和实战演练。 3. 全面覆盖的可视化技术 将详细讲解普通数据、多维数据以及专门领域数据的可视化技术,帮助你掌握多种可视化工具和方法,让你能够根据不同的数据类型和需求,快速生成直观、易懂的可视化图表,让数据“说话”。 4. 多算法对比与模型优化 将带你训练多种现存算法模型,并从多个角度进行对比分析。通过对比,你将深入了解不同算法的优缺点,掌握模型优化的技巧,从而能够根据实际问题灵活选择和优化算法模型,提升数据挖掘的准确性和效率。
—— 课程团队
课程概述


课程核心特色

1. 零门槛学习,无需环境搭建

市面上多数同类课程依赖本地环境配置,这不仅增加了学习的前期难度,还可能让许多初学者望而却步。然而,本课程基于阿里天池 AI 实训平台展开,学习者无需自行搭建复杂的学习环境,只需专注于代码学习与实践,轻松开启数据探索之旅。

2. 海量真实数据集,即开即用

天池 AI 实训平台不仅提供本教材附带的优质数据集,还拥有海量真实业务场景数据,涵盖地铁运行、工厂生产、医疗影像等多个领域。这些数据集即开即用,为学习者提供了丰富的实践素材,帮助大家在真实场景中锻炼技能,提升实战能力。

3. 前沿竞赛案例,接轨产业前沿

平台沉淀了众多天池算法竞赛的前沿案例,如某地区地铁运行数据分析、某工厂铝材识别项目、某医院肺结节标注数据等。这些案例不仅贴近产业实际需求,还融入了最新的算法应用成果,让学习者能够紧跟行业前沿动态,从理论到实践无缝衔接。

4. 完整实验课件与代码项目,减轻备课负担

基于实验项目,平台开发了完整的实验课件和代码项目,涵盖详细的实验指导、代码示例和操作说明。这不仅为学生提供了清晰的学习路径,还大大减轻了授课教师的备课工作量,让教学更加高效、便捷。

5. GPU资源支持,助力深度学习

除了丰富的学习资源,天池 AI 实训平台还为学习者提供GPU使用时间,这对于深入学习数据分析、机器学习和深度学习等高级内容至关重要。借助强大的计算资源,学生可以更高效地运行复杂模型,加速学习进程,提升学习效果。

课程受众与实践成果

本课程主要面向在校学生和授课教师,致力于为数据科学领域的学习者和教育者提供全方位的支持。经过两轮教学实践,本课程已获得师生的广泛好评。学生们不仅在课程学习中受益匪浅,还能借助平台自行部署代码,进一步拓展学习边界,深入探索数据分析与挖掘的更多可能。

选择本课程,你将获得一个高效、便捷、前沿的学习平台,开启数据科学的精彩之旅。让我们一起在天池 AI 实训平台上,探索数据的无限魅力,提升实战能力,迈向数据分析与挖掘的高手之路!

 

授课目标

掌握数据挖掘基础知识:了解数据挖掘的定义、核心思想、相关术语,对数据挖掘的方法体系形成总体认识。

熟悉阿里天池 AI 实训平台:掌握阿里天池 AI 实训平台的操作流程和环境配置,能够在平台上进行数据挖掘项目的开发和实践。

精通数据采集与预处理:学会使用多种工具和方法进行数据采集,掌握数据清洗、转换、降维等预处理技术,为数据分析做好充分准备。

掌握数据可视化技术:熟练运用多种可视化工具和技术,能够根据不同的数据类型和需求,设计并生成高质量的可视化图表,提升数据表达能力。

精通算法模型搭建与优化:掌握多种数据挖掘算法的原理和应用,能够根据实际问题选择合适的算法进行模型搭建,并通过对比分析和优化,提升模型性能。

课程大纲

1.数据挖掘概述

天池AI实训平台介绍

python的基础知识

2.数据预处理

处理连续型数据

数据预处理小案例

数据预处理大案例

归一化

标准化

缺失值处理

处理分类型数据

独热编码

3.数据可视化

Matplotlib基本图形可视化

高级图表绘制

4.回归分析

线性回归

其他回归

线性回归教材

5.关联规则分析

关联关联规则分析—Apriori算法和FP-growth

大气污染物和气象要素关联分析

关联规则分析教材

6.聚类分析

基于划分的聚类

基于层次的聚类

基于密度的聚类

案例讲解-基于K-means算法的高价值B站up主

7.决策树与随机森林

决策树

随机森林

简单算法之鸢尾花案例

8.神经网络

神经网络教材

BP算法

LSTM算法

9.贝叶斯分类

贝叶斯分类教材

朴素贝叶斯

贝叶斯网络

10.文本挖掘

文本挖掘教材

文本预处理

文本挖掘方法实现与结果可视化

新闻分类案例

电影评论分类案例

11.租房案例

租房案例之数据爬取

租房案例

展开全部
证书要求

为积极响应国家低碳环保政策, 2021年秋季学期开始,中国大学MOOC平台将取消纸质版的认证证书,仅提供电子版的认证证书服务,证书申请方式和流程不变。

 

电子版认证证书支持查询验证,可通过扫描证书上的二维码进行有效性查询,或者访问 https://www.icourse163.org/verify,通过证书编号进行查询。学生可在“个人中心-证书-查看证书”页面自行下载、打印电子版认证证书。

 

完成课程教学内容学习和考核,成绩达到课程考核标准的学生(每门课程的考核标准不同,详见课程内的评分标准),具备申请认证证书资格,可在证书申请开放期间(以申请页面显示的时间为准),完成在线付费申请。

 

认证证书申请注意事项:

1. 根据国家相关法律法规要求,认证证书申请时要求进行实名认证,请保证所提交的实名认证信息真实完整有效。

2. 完成实名认证并支付后,系统将自动生成并发送电子版认证证书。电子版认证证书生成后不支持退费。


参考资料

本课程以基于Python数据挖掘分析实验案例为主。课程主要分为三个模块:第一个模块是前2章,主要讲解大数据背景和数据预处理;第二个模块包括第3章到第12章共10章内容,主要讲解目前常用的数据挖掘算法;第三个模块指第13章介绍当下数据挖掘热门案例,系统运用前期的基础学习来进行学习知识的整合,促进学生们对数据挖掘知识的融会贯通。 该书内容丰富,实用性强,适合用作高等院校统计、大数据分析、人工智能等相关专业本科生教材和研究生教材,教材2025年在清华大学出版社出版。


本套实验案例呼应每章内容,学习者以案例和教材相结合更好的掌握每个章节的内容。课程结合天池AI实训平台,提供线上便捷的数据挖掘学习,优质的实验环境让数据挖掘的学习门槛变得更加的低。

“基于Python数据挖掘分析”课程天池AI实训平台链接:https://tianchi.aliyun.com/ailab/invite/course/a2UaBTbCdIzz4utfaywGhkrQAb2Dd3drbSRBbVM5

——来自天池AI实训平台 【诸葛斌】 的邀请

浙江工商大学
4 位授课老师
诸葛斌

诸葛斌

教授

洪金珠

洪金珠

讲师

蒋献

蒋献

讲师

推荐课程

【DeepSeek适用】小白玩转AI大模型应用开发

林粒粒

210人参加

小白玩转 Python 数据分析

林粒粒

78人参加
下载
下载

下载App