【教学模式】
课程主要采用课堂讲授与课程实验的混合教学模式. 课堂主要讲授数据分析的基本工具、基本原理和基本方法, 旨在帮助学生构建数据分析的基本思维, 掌握数据分析的基本流程. 课程实验主要通过数据分析实验训练学生实际动手能力, 旨在帮助学生掌握R语言, 并能够处理数据, 实现数据的可视化和统计建模.
【课程内容】
课程内容主要包括三个部分: R语言基础、数据分析基础,及统计方法与数据挖掘算法, 共15章内容. R语言基础主要讲授R语言的运行环境、R语言的语法、数据处理和数据可视化; 数据分析基础则主要讲授统计的基本概念、区间估计和假设检验; 统计方法与数据挖掘算法主要讲授相关性数据分析的方法(如: 列联表分析、方差分析、线性回归和Logistic回归)、分类算法(如: 分类的基本概念、决策树算法、KNN 算法、朴素贝叶斯算法和人工神经网络)、聚类算法(如: K-means聚类算法和层次聚类算法等)和Aprior 关联规则. 除通过课堂讲授相关模型和方法的基本原理外, 还通过课程实验加深学生对这些内容的理解, 并应用处理数据、分析数据.
1. 掌握数据分析的基本流程, 包括从数据处理, 数据分析到分析结果整理的过程.
2. 掌握数据分析的基本原理, 包括描述统计分析, 差异性和相关性分析, 以及基本数据建模方法.
3. 掌握数据分析的基本工具, 能够正确使用R软件和R包整理、分析数据.
《概率论与数理统计》
为积极响应国家低碳环保政策, 2021年秋季学期开始,中国大学MOOC平台将取消纸质版的认证证书,仅提供电子版的认证证书服务,证书申请方式和流程不变。
电子版认证证书支持查询验证,可通过扫描证书上的二维码进行有效性查询,或者访问 https://www.icourse163.org/verify,通过证书编号进行查询。学生可在“个人中心-证书-查看证书”页面自行下载、打印电子版认证证书。
完成课程教学内容学习和考核,成绩达到课程考核标准的学生(每门课程的考核标准不同,详见课程内的评分标准),具备申请认证证书资格,可在证书申请开放期间(以申请页面显示的时间为准),完成在线付费申请。
认证证书申请注意事项:
1. 根据国家相关法律法规要求,认证证书申请时要求进行实名认证,请保证所提交的实名认证信息真实完整有效。
2. 完成实名认证并支付后,系统将自动生成并发送电子版认证证书。电子版认证证书生成后不支持退费。
[1] 统计学——基于R(第4版), 贾俊平 著, 中国人民大学出版社, 2021.
[2] R语言核心技术手册(第2版), 刘思喆, 李舰, 陈钢, 邓一硕 译, 电子工业出版社, 2014.
[3] 数据挖掘与R语言(原书第2版), [葡] 路易斯·托尔戈 著, 李洪成 译, 机械工业出版社, 2018.