认证学习
大数据解析与应用导论
第12次开课
开课时间: 2025年04月05日 ~ 2025年06月25日
学时安排: 1-3小时每周
距离开课还有 1 天 已有 125 人参加
认证学习
认证成绩和证书
智能问答和解析
视频学习辅助
立即参加
课程详情
课程评价(1445)
spContent=“大数据分析”是时下炙手可热的概念,如何更好地理解数据,对海量数据进行分析并做出智能决策是科研工作者面临的机遇与挑战。本课程从大数据解析的原理讲起,在介绍几种流行的数据挖掘方法的同时,密切结合工业等不同领域的研究实例,帮助同学们掌握大数据解析的模型与方法,为各行各业的大数据赋能。本课程已获得浙江省一流本科课程(线上),出版的同名配套教材《大数据解析与应用导论》(化工出版社,2022年5月)入选新工科自动化国家级特色专业系列教材。
“大数据分析”是时下炙手可热的概念,如何更好地理解数据,对海量数据进行分析并做出智能决策是科研工作者面临的机遇与挑战。本课程从大数据解析的原理讲起,在介绍几种流行的数据挖掘方法的同时,密切结合工业等不同领域的研究实例,帮助同学们掌握大数据解析的模型与方法,为各行各业的大数据赋能。本课程已获得浙江省一流本科课程(线上),出版的同名配套教材《大数据解析与应用导论》(化工出版社,2022年5月)入选新工科自动化国家级特色专业系列教材。
—— 课程团队
课程概述

“大数据”这个概念几乎应用到了所有人类智力与发展的领域中。《大数据时代》这本书中有一句话:人类从依靠自身判断做决定到依靠数据做决定的转变,也是大数据作出的最大贡献之一。本课程从大数据解析的基本概念讲起,进而介绍大数据解析中常用的基础算法,包括数据预处理相关算法、判别分析、回归分析、聚类分析、决策树、典型相关分析、神经网络、自编码器和集成学习等,同时结合具体应用,帮助同学们深入学习数据挖掘的模型与方法,掌握大数据解析的钥匙,为各行业特别是工业大数据赋能。希望大家在学习的过程中,能够了解和认识到:本课程是一门实战性很强的基础课程,纸上得来终觉浅,绝知此事要躬行;抓准具体对象本身的特点、特性和问题,以问题驱动,而非以方法为导向,不要哪个方法热,追逐哪个,切忌脱离问题空谈花哨的方法;活用数据,不要迷信数据以及被数据绑架。

本课程的特色主要包括:

1)本课程讲授大数据分析的基本原理、相关方法和实例分析,让学生能够形成大数据思维意识,加深对课程知识的理解。

2)课程中介绍了大量的大数据应用案例,这些案例包括但不限于工业领域,为大家提供不同学科方向的思考和启发。

3)课程之余鼓励学生主动发现和思考生活中的大数据场景,将课程内容与实际紧密结合。

授课目标


课程大纲
绪论
1.1 课程综述1
1.2 课程综述2
1.3 基本内容
1.4 多元统计基础
数据预处理及特征提取
2.1 数据清洗
2.2 数据预处理与特征提取
2.3 主成分分析1
2.4 主成分分析2
2.5 应用实例
判别分析
3.1 基本原理
3.2 距离判别
3.3 fisher判别
3.4 贝叶斯判别
3.5 SVM(1)
3.6 SVM(2)
回归分析
4.1 基本概念
4.2 最小二乘回归
4.3 岭回归
4.4 主元回归
4.5 偏最小二乘
聚类分析
5.1 基本思想
5.2 相似性度量
5.3 K-means聚类算法
5.4 高斯混合模型
决策树
6.1 基本内容
6.2 决策树算法
6.3 随机森林
6.4 实例应用
典型相关分析
7.1 基本概念
7.2 CCA算法介绍
7.3 CCA算法拓展
7.4 案例分析
神经网络
8.1 基本概念与结构发展
8.2 卷积神经网络(CNN)
8.3 循环神经网络(RNN)
8.4 应用实例
自编码器
9.1 自编码器简介
9.2 去噪自编器
9.3 稀疏自编码器
9.4 变分自编码器
案例分析
10.1 二手车交易价格预测
10.2 糖尿病的血糖预测
10.3 工业蒸汽量预测
10.4 双盲降噪自编码器实现降噪
10.5 心电数据分析
展开全部
预备知识

本课程需要学习者具备概率论与数理统计、机器学习、Python语言编程的基本知识和初步技能。

参考资料

MOOC课程配套教材


    本MOOC课程配套教材:赵春晖. 大数据解析与应用导论[M]. 化学工业出版社, 2022.

    从筹备到最后出版历经1年半多,我们的《大数据解析与应用导论》教材于2022年5月正式出版,成为浙江大学本科生专业选修课程、中国大学慕课同名课程的配套教材。自2018年本人首次独立申请并开设本课,累计独立完成10次线下授课,9次中国大学慕课线上授课,还在持续不断努力完善中。大家如有购书需求,可以在京东和当当等平台直接搜索书名购书。希望能在大家指导帮助下,不断修改完善我们的课程和教材。大家如有建议和问题可以直接联系本人,期待大家为教材修订提供宝贵意见。

    其他参考资料:

[1] 赵春晖,余万科,柴峥,冯良骏. 运行工况监测与故障溯源推理:机器学习方法[M]. 化学工业出版社, 2022.(适合了解工业背景、工业机器学习方法和应用)

[2] 赵春晖,王福利. 工业过程运行状态智能监控:数据驱动方法[M]. 化工出版社, 2019.(适合了解工业背景、工业机器学习方法和应用)

[3] 周志华. 机器学习: Machine learning[M]. 清华大学出版社, 2016. (机器学习的西瓜书)

常见问题

Q:每周会发布多少时间的内容?我需要多少时间来学习?

A:每节课的视频时长一般控制在25分钟以内,一般在1020分钟左右。但是除了视频内容,课后还需要花费1:11:2的时间进行课后学习,包括预习、讨论、作业和复习的时间,一周花费的总时长大概是一到三小时。

浙江大学
1 位授课老师
赵春晖

赵春晖

教授

推荐课程

心理学入门

陈红兵

98649人参加

情商与智慧人生

董宇艳

79668人参加

高等数学

颜文勇

145311人参加

高等数学(下)

朱雯

93196人参加
下载
下载

下载App