课程

中国大学MOOC,为你提供一流的大学教育

hi,小mooc
SPOC学校专有课程
Python数据分析与数据可视化
第2次开课
开课时间: 2021年02月28日 ~ 2021年07月04日
学时安排: 3
当前开课已结束 已有 88 人参加
老师已关闭该学期,无法查看
spContent=1)掌握数据分析、挖掘、可视化时需要了解的Python基础知识; 2)掌握扩展库numpy数组运算与矩阵运算; 3)掌握扩展库pandas在数据分析与处理相关领域的相关技术; 4)掌握扩展库sklearn机器学习常用模型的实现与应用; 5)掌握扩展库matplotlib在数据可视化与科学计算可视化方面的应用。
1)掌握数据分析、挖掘、可视化时需要了解的Python基础知识; 2)掌握扩展库numpy数组运算与矩阵运算; 3)掌握扩展库pandas在数据分析与处理相关领域的相关技术; 4)掌握扩展库sklearn机器学习常用模型的实现与应用; 5)掌握扩展库matplotlib在数据可视化与科学计算可视化方面的应用。
—— 课程团队
课程概述

数据分析、数据挖掘与数据可视化是一个古老的话题,并非什么新生事物。近些年来,借助于计算机软硬件的飞速发展,数据分析、挖掘、可视化相关理论和技术在各领域的应用更是有了质的飞跃。饭店选址、公交路线与站牌规划、物流规划、春运加班车次安排、原材料选购、商场进货与货架位置摆放、查找隐性贫困生、房价预测、股票预测、寻找黑客攻击向量、犯罪人员社交关系挖掘、网络布线、潜在客户挖掘、个人还贷能力预测、异常交易分析、网络流量预测、成本控制与优化、客户关系分析、商品推荐、文本分类、笔迹识别与分析、智能交通、智能医疗,这些都要借助于数据分析与挖掘相关的理论和工具才能更好更快地完成,而可视化则一直是用来辅助数据分析、挖掘进而做出正确决策的有力工具与技术。

数据分析、数据挖掘与数据可视化是一门综合性非常强的学科领域,既要掌握线性代数、统计学、人工智能、机器学习等大量理论知识,又要熟悉编程语言或相关软件的使用。

在众多编程语言中,Python应该是最适合做数据分析、数据挖掘和数据可视化的,其简洁的语法、强大的功能、丰富的扩展库以及开源免费、易学易用的低门槛特点,使得Python成为多个领域不可替代的语言。

课程主要内容和目标:

1)掌握数据分析、挖掘、可视化时需要了解的Python基础知识;
2)掌握扩展库numpy数组运算与矩阵运算;
3)掌握扩展库pandas在数据分析与处理相关领域的相关技术;
4)掌握扩展库sklearn机器学习常用模型的实现与应用;
5)掌握扩展库matplotlib在数据可视化与科学计算可视化方面的应用。

授课目标

1)掌握数据分析、挖掘、可视化时需要了解的Python基础知识;
2)掌握扩展库numpy数组运算与矩阵运算;
3)掌握扩展库pandas在数据分析与处理相关领域的相关技术;
4)掌握扩展库sklearn机器学习常用模型的实现与应用;
5)掌握扩展库matplotlib在数据可视化与科学计算可视化方面的应用。

成绩 要求

课程最终学习成绩由单元测验(60%)、考试(35%)、课程讨论(5%)这几部分组成。

课程大纲

第1章 Python开发环境搭建与编码规范

1.3 标准库、扩展库对象的导入与使用

单元测验

1.2 Python编码规范

1.1 Python开发环境搭建与使用

第2章 数据类型、运算符与内置函数

2.1.1 概述、整数、实数、复数

2.1.2 列表、元组、字典、集合、字符串

2.3.2 内置函数-最大值、最小值、元素数量与求和

2.4 综合应用与例题解析

2.4.5 内置函数-map()、reduce()、filter()

2.3.4 内置函数-range()、zip()

单元测验

2.2.2 成员测试运算符、集合运算符、逻辑运算符

2.3.3 内置函数-排序、逆序、基本输入与输出

2.2.1 算术运算符、关系运算符

2.3.1 内置函数-类型转换

第3章 列表、元组、字典、集合与字符串

3.1.3 列表推导式、切片操作

3.1.2 列表常用方法

3.6.1 综合应用与例题解析1

3.5 字符串及常用方法

3.6.2 综合应用与例题解析2

3.3 字典及常用操作

3.2 元组与生成器表达式

单元测验

3.1.1 创建列表、下标访问

3.4 集合及常用方法

第5章 文件操作

5.3 Word、Excel、PowerPoint文件操作实战

单元测验

5.1 文件操作基础知识

5.2 JSON、CSV文件操作

第4章 选择结构、循环结构、函数定义与使用

单元测验

4.3 函数定义与使用

4.1 选择结构

4.4 综合例题解析

4.2 循环结构

第6章 numpy数组与矩阵运算

6.2.2 矩阵乘法、计算相关系数矩阵、方差、协方差、标准差

6.1.1 创建数组、测试数组元素是否接近、修改数组元素值

6.2.1 生成矩阵、矩阵转置、查看矩阵特征

6.1.3 数组对函数运算的支持、改变形状、布尔运算、分段函数

6.1.2 数组与标量和数组的运算、排序、内积、元素访问

单元测验

6.2.3 计算特征值与特征向量、计算逆矩阵、求解线性方程组

6.2.4 计算向量和矩阵的范数、奇异值分解

第7章 pandas数据分析实战

7.2.4 处理超市交易数据中的异常值、缺失值、重复值、数据差分

7.2.6 重采样、多索引、标准差与协方差

7.1.1 一维数组与常用操作

单元测验

7.1.2 时间序列与常用操作

7.2.3 使用分组与聚合对员工业绩进行汇总

7.2.8 绘制各员工在不同柜台业绩平均值的柱状图、数据拆分与合并

7.2.5 使用透视表与交叉表查看业绩汇总数据

7.2.7 使用pandas的属性接口实现高级功能

7.1.3 二维数组DataFrame基础知识

7.2.2 查看数据特征和统计信息、按不同标准对数据排序

7.2.1 读取Excel文件中的数据、筛选符合特定条件的数据

第8章 sklearn机器学习实战

8.5.2 DBSCAN算法应用

8.2.2 支持向量机手写数字图片识别-交叉验证与网格搜索

8.1.2 朴素贝叶斯算法中文邮件分类-获取全部邮件文本中出现次数最多的前N个词汇

单元测验

8.2.1 支持向量机手写数字图片识别-图像数据读取

8.1.3 朴素贝叶斯算法中文邮件分类-使用朴素贝叶斯模型进行邮件分类

8.3 KNN算法原理与sklearn实现

8.5.1 DBSCAN算法原理

8.4 分层聚类算法原理与应用

8.1.1 朴素贝叶斯算法中文邮件分类-提取邮件文本有效词汇

第9章 matplotlib数据可视化实战

9.3 绘制饼状图实战

9.1 绘制折线图实战

9.7 设置图例样式

9.4 绘制雷达图实战

9.8.3 使用交互组件

9.8.2 绘制动态柱状图

9.6 绘图区域切分

9.5 绘制三维图形实战

单元测验

9.8.1 鼠标事件响应

9.2 绘制散点图实战

展开全部
参考资料
  1. 教材:《Python数据分析、挖掘与可视化》,董付国,人民邮电出版社

  2. 参考书:《Python可以这样学》,董付国,清华大学出版社

  3. 参考书:《Python程序设计开发宝典》,董付国,清华大学出版社

  4. 参考书:《Python程序设计》(第三版),董付国,清华大学出版社

  5. 参考书:《Python程序设计基础》(第二版),董付国,清华大学出版社

  6. 参考书:《Python程序设计基础与应用》,董付国,机械工业出版社

山东工商学院
1 位授课老师
董付国

董付国

副教授

下载
下载

下载App