spContent=统计是一种归纳思维过程,通过收集、分析和解释数据,刻画斑斓世界背后的规律,为正确决策提供定量依据,发挥着经世济用的作用。本课程将从数据开始,带领大家进入统计学的世界。
统计是一种归纳思维过程,通过收集、分析和解释数据,刻画斑斓世界背后的规律,为正确决策提供定量依据,发挥着经世济用的作用。本课程将从数据开始,带领大家进入统计学的世界。
—— 课程团队
课程概述
《有用的统计学》课程是国务院学位委员会统计学科评议组成员、全国应用统计专业学位研究生教育指导委员会成员、知名统计学专家刘扬教授领衔的团队,依托先后获批国家重点学科、北京市一级重点学科的中央财经大学统计学科,历经国家级、北京市级特色专业、北京市优秀教学团队等项目的持续资助,数年锤炼的结晶。课程紧随世界数据科学教育前沿的动态变化,面向大数据的时代需求,不断吐故纳新,先后获评北京市精品课程、北京市精品教材,获得全国统计科研优秀成果统计教学奖。
统计学是关于数据的科学。本课程有三个部分:数据收集;数据整理和数据分析。
在数据收集阶段,将介绍取得数据的各种调查方法,如何控制误差?如何通过网络爬虫获取数据,等等。
在数据整理阶段,讲授数据的整理方法,对数据做分类和可视化。
在数据分析阶段,我们将讲授统计学中最基础的估计和检验,掌握生活中“平均”、“显著”等表述背后的“统计”含义。多元统计是数据分析中很有用的方法,我们还将学习如何用它们解决实际问题。
本课程将教授统计软件R。希望学员已经学习过微积分、线性代数和概率论等课程。
祝大家学习愉快,了解统计学、掌握统计方法,让统计学伴你成长!
课程大纲
数据从哪儿来
课时目标:了解数据有哪些来源、各种来源途径的特征;理解抽样调查和调查数据的误差;初步掌握网络数据采集的方法
2.1 数据的来源
2.2 抽样调查与误差
2.3 网络数据采集
描述分析
课时目标:能判断不同数据(变量)属于什么类型;能够根据数据的类型和分析目标来选择合适的描述分析方法;初步掌握如何使用R语言开展描述分析
3.1 数据和变量
3.2 用数值特征做描述分析
3.3 用统计表和统计图做描述分析:单变量
3.4 用统计表和统计图做描述分析:双变量
3.5 描述分析的R语言操作
统计推断
课时目标:掌握统计推断的基本思想,理解其工作目标;能够用参数估计和假设检验来完成统计推断任务;初步掌握如何使用R语言开展统计推断
4.1 统计推断的基本概念
4.2 参数估计
4.3 假设检验
4.4 参数估计和假设检验的R语言操作
比较均值
课时目标:掌握如何对两个总体、多个总体的均值比较开展统计推断;初步掌握如何使用R语言开展均值比较
5.1 两总体均值检验
5.2 方差分析
5.3 两总体均值检验和方差分析的R语言操作
回归分析
课时目标:理解回归分析的本质和工作目标;掌握线性回归模型的形式,如何开展估计、如何解读结果;初步掌握如何使用R语言开展回归分析
6.1 回归分析的基本概念
6.2 最小二乘估计
6.3 回归结果解读
6.4 其他类型回归
6.5 回归分析的R语言操作
分类方法
课时目标:理解分类问题及其工作目标;学习两种重要的分类方法:判别分析、Logistic回归,掌握它们的基本原理、结果解读方法;初步掌握如何使用R语言开展判别分析、Logistic回归建模分析
7.1 判别分析
7.2 Logistic回归
7.3 判别分析和Logistic回归的R语言操作
聚类分析
课时目标:理解聚类问题及其工作目标;学习两种常用的聚类方法:系统聚类、K均值聚类,掌握它们的基本原理、结果解读方法;初步掌握如何使用R语言开展聚类分析
8.1 系统聚类
8.2 K均值聚类
8.3 系统聚类和K均值聚类的R语言操作
降维方法
课时目标:理解降维问题及其工作目标;学习两种常用的降维方法:主成分分析、因子分析,掌握它们的基本原理、结果解读方法;初步掌握如何使用R语言开展降维分析
9.1 主成分分析
9.2 因子分析
9.3 主成分分析和因子分析的R语言操作
展开全部
预备知识
希望学员已经学习过微积分、线性代数和概率论等课程。
证书要求
1. 总成绩(100分)构成:
单元测验:30%;
单元作业:10%;
期末考试:50%;
课程讨论:10%(注意:必须是在“课堂交流区”的讨论才计入成绩,在其他讨论区的讨论不计入成绩)。
2. 证书要求
合格证书:60~84分
优秀证书:85分及以上
3. 说明
课程讨论以活跃度为判断依据,学生需在“课堂讨论区”内进行至少3次有效讨论方能获得该部分满分。没有进行有效讨论的,“课程讨论”指标得分为0;有1次有效讨论的,得3分;2次有效讨论,得6分;3次及以上有效讨论,得10分。