机器学习
分享
课程详情
课程评价
spContent=机器学习是人工智能的核心研究领域之一, 其研究动机是为了让计算机系统具有人的学习能力以便实现人工智能。本课程将以数据挖掘中的分类任务为例,首先讲解分类模型的评估,然后讲解一批经典而常用的机器学习技术。加入到我们的课程,一起进入机器学习的世界、发掘潜藏在数据中的奥秘和财富吧!
—— 课程团队
课程概述

201639日至15日谷歌人工智能围棋程序阿尔法狗AlphaGo以总比分41战胜世界围棋冠军李世石。 2017523日至27日,又在浙江乌镇的围棋峰会上,以总比分30完胜我国世界排名第一的棋手柯洁。赛后柯洁一度哽咽称:它太完美,我很痛苦,看不到任何胜利的希望”  201716日,最强大脑第四季引入人机大战模式,百度人工智能机器人小度作为特别选手参赛,在比赛中战胜了最强大脑的队长:王峰。

 

随着摩尔定律带来的芯片计算能力和存储能力大幅提升,以及大数据时代的来临,不仅让谷歌人工智能围棋程序阿尔法狗AlphaGo和百度人工智能机器人小度一炮走红,也将人工智能研究推向了一个新的高潮。

 

20170708日国务院印发新一代人工智能发展规划的通知。宣布:举全国之力,在2030年一定要抢占人工智能全球制高点。” 201842日,教育部印发《高等学校人工智能创新行动计划》,明确指出:加快机器学习等新一代人工智能核心关键技术研究

 

机器学习的研究动机是为了让计算机系统具有人的学习能力以便实现人工智能。目前被广泛采用的机器学习定义是利用经验来改善计算机系统自身的性能。由于经验在计算机系统中主要是以数据的形式存在的,因此机器学习需要运用机器学习技术对数据进行分析,这就使得它逐渐成为智能数据分析技术的创新源之一,并且为此而受到越来越多的关注。

 

本课程将以数据挖掘中的分类任务为例,首先讲解分类模型的评估,然后讲解一批经典而常用的机器学习技术。具体的章节安排如下:第1章:绪论。讲解机器学习的定义、与数据挖掘的区别与联系、本课程的授课思路与内容安排、以及本课程所使用的教材及参考书。第2章:讲解模型评估的方法、指标、以及比较检验。第3-9章:讲解机器学习的基础技术:以线性回归开始,讲解线性学习;以K均值聚类收尾,讲解无监督学习;中间包括支持向量机学习、神经网络学习、决策树学习、贝叶斯学习、以及最近邻学习。第10-13章:讲解机器学习的进阶技术:具体包括集成学习、代价敏感学习、演化学习、以及强化学习。

 

加入到我们的课程,一起进入机器学习的世界、发掘潜藏在数据中的奥秘和财富吧!


授课目标

了解机器学习的基本方向;掌握机器学习的基本算法;掌握运用WEKA平台实现机器学习算法的方法;了解机器学习的有关研究思想,从中学习开拓者们求解问题的部分方法;通过实验进一步体会有关学习算法的用法和性能,切实提高机器学习算法的编程应用能力。


课程大纲
预备知识

先修课程:高等数学、概论论与数理统计、线性代数、离散数学、大学物理、计算机高级语言程序设计、数据结构、计算方法、算法设计与分析、数据库系统概论


证书要求

学生完成80%以上的课程学习,并且在期末考试试卷中选择2题以上进行编程实现并完成相关实验测试,其中第一题是必选题。

1)        熟练掌握WEKA实验平台的安装、使用、以及二次开发方法(40分)

2)        逻辑斯蒂回归算法的的实现及实验测试 20分)

3)        SMO分类算法的实现及实验测试(20分)

4)        BP分类算法的实现及实验测试(20分)

5)        ID3分类算法的实现及实验测试(20分)

6)        NB分类算法的实现及实验测试(20分)

7)        KNN分类算法的实现及实验测试(20分)

8)        K-Means聚类算法的实现及实验测试(20分)

9)        随机森林算法的实现及实验测试(20分)

10)    演化朴素贝叶斯算法的实现及实验测试(20分)

由任课教师签发课程结业证书,其中60≤成绩<80者获得合格证书,成绩≥80者将获得优秀证书。


参考资料

1)        周志华著. 机器学习. 清华大学出版社, 2016

2)        Tom M. Mitchell, 曾华军等译. 机器学习. 机械工业出版社, 1997.

3)        于剑著. 机器学习:从公理到算法. 清华大学出版社, 2017.

4)        Jiawei Han等著, 范明等译. 数据挖掘:概念与技术(第3版). 机械工业出版社, 2012.

5)        Pang-Ning Tan等著, 范明等译. 数据挖掘导论. 人民邮电出版社, 2006.

6)        I. H. Witten等著, 董琳等译. 数据挖掘:实用机器学习工具与技术(第4版), 机械工业出版社, 2018.

 


常见问题

Q :  先修课程都是必须的吗?

A :  不是必须的。

Q :  课程考核需要编程实现一种算法并完成实验测试,需要有很好的编程能力吗?

A :  推荐使用开源的机器学习与数据挖掘实验平台WEKA来实现课程讲授的算法并完成实验测试。

Q :  实验平台WEKA容易学吗?

A :  WEKA平台非常好学,在WEKA平台里面实现课程讲授的算法只需具体实现建模buildClassifier()和预测distributionForInstance()或者classifyInstance()两个函数就可以了。

Q :  实验平台WEKA的学习有参考资料吗?

A :  关于WEKA平台的安装、使用、以及二次开发方法具体可参阅教材:I. H. Witten等著, 董琳等译. 数据挖掘:实用机器学习工具与技术(第4版), 机械工业出版社, 2018. 如果有学员需要,任课教师可发布一个关于WEKA平台的操作流程与使用说明。

Q :  期末考试是必须的吗?

A :  需要课程结业证书的学员必须参加期末考试。

Q :  课程的学时安排是什么?

A :  课程每个教学单元(即每周)包含4个教学视频的知识点讲解及相应的教学PPT,建议学员每个教学单元(即每周)的内容用4-6小时进行学习和消化。