SPOC学校专有课程
大数据下的生存指导
分享
spContent=本课程是面向全校学生开设的通识课程,旨在培养学生在大数据时代背景下,从计算角度获取观察、思考并解决问题的能力,为学生搭建高通量数字化生存的桥梁和纽带。课程介绍大数据处理的具体场景、并通过实践操作获取解决问题的手段,为学生在自身专业领域结合数据应用背景提供导向及知识储备基础。
—— 课程团队
课程概述

本课程是零基础的入门课程,目标是帮助学生建立数据处理的知识体系,获取从数据的视角解决实际问题的能力:

  1. 了解大数据的典型应用,以数据的角度思考、分析现实生活中数据模式;

  2. 建立对大数据知识体系的轮廓线认识,了解基本概念、关键技术、计算模型及相关产业发展;

  3. 了解大数据分析的典型性方法,初步掌握相关算法的原理及应用方法;

  4. 思考发展趋势,结合专业优势构建应用场景。


授课目标
  • 能够建立对大数据知识体系的轮廓性认识,了解大数据发展历程、基本概念、主要影响、应用领域、关键技术、计算模式和产业发展,并了解云计算的概念及其与大数据之间的紧密关系;

  • 能够了解分布式大数据处理架构Hadoop的基本原理,Hadoop项目结构及其各个组件,并了解Hadoop平台的使用方法;

  • 能够了解大数据的存储技术,理解分布式文件系统的基本概念和结构,了解分布式文件系统HDFS的原理和使用方法;

  • 能够了解NoSQL数据库的基本概念,了解NewSQL数据库的基本概念和主流产品;

  • 能够了解大数据分析的典型方法,如聚类、分类等分析方法,初步掌握典型算法的原理与应用方法;

  • 能够了解数据可视化的基本方法和常用工具,学习相关的案例,并进行数据可视化的实践操作。

  • 能够联系实际,了解大数据的典型应用,对大数技术的未来发展趋势有一定了解。


成绩 要求

本课程的总评分采取百分制,在线学习成绩(60%)+编程作品成绩(40%)。




课程大纲
预备知识


参考资料

《大数据》  张尧学,机械工业出版社,2018.8


《大数据技术原理与应用(第2版)》, 林子雨, 人民邮电出版社, 2017


《白话大数据与机器学习》, 高扬 卫峥 伊会生, 机械工业出版社, 2016


《机器学习》, 周志华, 清华大学出版社, 2015


《大数据时代》 维克托·迈尔-舍恩伯格 浙江人民出版社,2013


常见问题

Q: 需要计算机专业背景吗?

A:  不需要。本课程是面向所有同学的通识课程,旨在引导同学们从"数据"的角度进行思考,并应用于自己的专业中。


Q: 文科生学这个有用吗?

A:  现在,我们的生活在俯仰之间都和大数据产生着千丝万缕的联系,微软使用“大数据”来写对联,社交网站利用数据来做情感分析,在大数据里遣词造句,别具一番风味。


Q: 好多概念看起来很抽象,怎么学?

A: 课程力求从现实生活切入,从具体案例入手,从中抽象出相关的概念并加入深入挖掘,再通过对应的实践案例练手,形成从:感性->抽象->实践 的动态认知过程。