spContent=《R语言数据分析与挖掘》是一门经济管理类专业基础课, 是进一步学习相关学科专业课程的基础, 也是经济管理工作者和研究人员所必备的一门知识. 该课程主要基于R语言介绍如何用科学的方法搜集、整理、分析数据, 从而揭示数据中蕴含的客观规律, 为科学决策提供依据.
《R语言数据分析与挖掘》是一门经济管理类专业基础课, 是进一步学习相关学科专业课程的基础, 也是经济管理工作者和研究人员所必备的一门知识. 该课程主要基于R语言介绍如何用科学的方法搜集、整理、分析数据, 从而揭示数据中蕴含的客观规律, 为科学决策提供依据.
—— 课程团队
课程概述
【教学模式】
课程主要采用课堂讲授与课程实验的混合教学模式. 课堂主要讲授数据分析的基本工具、基本原理和基本方法, 旨在帮助学生构建数据分析的基本思维, 掌握数据分析的基本流程. 课程实验主要通过数据分析实验训练学生实际动手能力, 旨在帮助学生掌握R语言, 并能够处理数据, 实现数据的可视化和统计建模.
【课程内容】
课程内容主要包括三个部分: R语言基础、数据分析基础,及统计方法与数据挖掘算法, 共15章内容. R语言基础主要讲授R语言的运行环境、R语言的语法、数据处理和数据可视化; 数据分析基础则主要讲授统计的基本概念、区间估计和假设检验; 统计方法与数据挖掘算法主要讲授相关性数据分析的方法(如: 列联表分析、方差分析、线性回归和Logistic回归)、分类算法(如: 分类的基本概念、决策树算法、KNN 算法、朴素贝叶斯算法和人工神经网络)、聚类算法(如: K-means聚类算法和层次聚类算法等)和Aprior 关联规则. 除通过课堂讲授相关模型和方法的基本原理外, 还通过课程实验加深学生对这些内容的理解, 并应用处理数据、分析数据.
授课目标
1. 掌握数据分析的基本流程, 包括从数据处理, 数据分析到分析结果整理的过程.
2. 掌握数据分析的基本原理, 包括描述统计分析, 差异性和相关性分析, 以及基本数据建模方法.
3. 掌握数据分析的基本工具, 能够正确使用R软件和R包整理、分析数据.
课程大纲
R语言基础
课时目标:熟悉R语言运行环境,掌握R的基本语法、熟练应用R处理数据
1.1 R安装及运行环境
1.2 数据类型及对象
1.3 数据读取和数据处理
数据可视化
课时目标:熟练掌握基于表格、基于图形的R可视化方法和工具
3.1 基于表格的数据可视化
3.2 基于图形的数据可视化
概率与概率分布
课时目标:熟悉数理统计的基本理论
5.1 随机事件及其概率
5.2 随机变量
5.3 由正态分布诱导的几个重要分布
参数估计
课时目标:熟练掌握总体均值、总体比例、总体方差的区间估计方法、原理
7.1 参数估计的原理
7.2 总体均值的区间估计(上、下)
7.3 总体比例的区间估计
7.4 总体方差的区间估计
假设检验
课时目标:熟练掌握总体均值、总体比例、总体方差的检验方法、原理
8.1 假设检验的基本原理
8.2 总体均值的检验
8.3 总体比例的检验
8.4 总体方差的检验
8.5 非参数检验
列联表分析
课时目标:熟练掌握分类变量之间关系的分析方法、原理
9.1 一个类别变量的拟合优度检验
9.2 两个类别变量的独立性检验与相关性度量
方差分析
课时目标:熟练掌握分类变量与数值变量之间关系的分析方法、原理
10.1 方差分析的原理
10.2 单因子方差分析
10.3 双因子方差分析
10.4 方差分析的假定及其检验
10.5 单因子方差分析的非参数方法
一元线性回归
课时目标:熟练掌握因变量为数值型变量的分析方法、原理、步骤
11.1 变量间关系的度量
11.2 模型估计和检验
11.3 利用回归方程进行预测
11.4 回归分析过程示例
多元线性回归
课时目标:熟练掌握因变量为数值型变量的分析方法、原理、步骤、结果解释、回归基本问题的处理方法
12.1 多元线性回归模型概述
12.2 拟合优度和显著性检验
12.3 多重共线性
12.4 相对重要性和模型比较
12.5 虚拟变量回归
Logistic回归
课时目标:熟练掌握因变量为分类型变量的分析方法、原理、步骤、结果解释
13.1 Logistic回归的基本原理
13.2 Logistic回归实例分析
分类算法
课时目标:熟练掌握数据挖掘中的分类模型的基本原理、方法、分析步骤
14.1 分类的基本概念
14.2 决策树算法
14.3 KNN 算法
14.4 朴素贝叶斯算法
14.5 人工神经网络
聚类算法和关联规则
课时目标:熟练掌握数据挖掘中的聚类模型和关联规则的基本原理、方法、分析步骤
15.1 聚类的基本概念
15.2 K-means聚类算法
15.3 层次聚类算法与其他
15.4 Aprior 关联规则
展开全部
预备知识
参考资料
[1] 统计学——基于R(第4版), 贾俊平 著, 中国人民大学出版社, 2021.
[2] R语言核心技术手册(第2版), 刘思喆, 李舰, 陈钢, 邓一硕 译, 电子工业出版社, 2014.
[3] 数据挖掘与R语言(原书第2版), [葡] 路易斯·托尔戈 著, 李洪成 译, 机械工业出版社, 2018.