spContent=计算机视觉(Computer Vision)又称为机器视觉(Machine Vision),顾名思义是一门“教”会计算机如何去“看”世界的学科。在机器学习大热的前景之下,计算机视觉与自然语言处理(Natural Language Process, NLP)及语音识别(Speech Recognition)并列为机器学习方向的三大热点方向。而计算机视觉也由诸如梯度方向直方图(Histogram of Gradient, HOG)以及尺度不变特征变换(Scale-Invariant Feature Transform, SIFT)等传统的手办特征(Hand-Crafted Feature)与浅层模型的组合逐渐转向了以卷积神经网络(Convolutional Neural Network, CNN)为代表的深度学习模型。
计算机视觉(Computer Vision)又称为机器视觉(Machine Vision),顾名思义是一门“教”会计算机如何去“看”世界的学科。在机器学习大热的前景之下,计算机视觉与自然语言处理(Natural Language Process, NLP)及语音识别(Speech Recognition)并列为机器学习方向的三大热点方向。而计算机视觉也由诸如梯度方向直方图(Histogram of Gradient, HOG)以及尺度不变特征变换(Scale-Invariant Feature Transform, SIFT)等传统的手办特征(Hand-Crafted Feature)与浅层模型的组合逐渐转向了以卷积神经网络(Convolutional Neural Network, CNN)为代表的深度学习模型。
—— 课程团队
课程概述
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所 指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提 取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。
授课目标
了解计算机视觉的发展历史、相关学科、应用领域和研究方向,培养学生学习兴趣,引导学生关注学科前沿和业界动态。
掌握基本的图像预处理和特征提取的原理和方法;掌握卷积神经网络的相关知识(损失函数、正则化和梯度下降优化算法);为后续内容提供基础。
掌握图像分类、目标检测、语义分割、场景理解和图像生成等的原理和经典算法,使学生具备基本的方向知识和研究方法,并能够自主拓展学习或解决相关问题。
课程大纲
计算机视觉概要
计算机视觉概要课程导学
1.1 计算机视觉发展历史
1.2 计算机视觉应用
图像生成与表示
图像生成与表示课程导学
2.1 成像设备
2.2 数字图像
2.3 摄像机标定
2.4 从2D到3D
2.5 图像文件格式
颜色和纹理分析
颜色和纹理分析课程导学
3.1 颜色物理学
3.2 基色系统
3.3 明暗分析
3.4 纹理与描述
3.5 纹理测度
图像滤波和增强
图像滤波和增强课程导学
4.1灰度级映射
4.2 去噪滤波
4.3 图像平滑
4.4 卷积
图像分割
图像分割课程导学
5.1 聚类方法
5.2 区域增长
5.3 区域表示
5.4 canny边缘检测
5.5 Hough变换
5.6 自适应阈值分割
三维视觉感知
三维视觉感知课程导学
6.1 三维视觉概述
6.2 仿射变换
6.3 双目视觉
6.4 结构光原理
6.5 三维重建
深度学习
深度学习课程导学
7.1 机器学习
7.2 人工神经网络
7.3 深度学习基本原理
7.4 深度学习模型
7.5 深度学习应用
视觉SLAM
视觉SLAM课程导学
8.1 ROS操作系统
8.2 经典视觉SLAM框架
8.3 三维空间刚体运动
8.4 位姿估计
8.5 点云配准
视觉高级任务实践
导读
9.1.1 深度学习发展与AI框架
9.1.2 昇腾与MindSpore简介
9.2.1 张量基础
9.2.2 卷积与卷积神经网络
9.2.3 卷积操作与自定义算子开发
9.2.4 感知机与人工神经网络
9.2.5 MindSpore实现MLP和人工神经网络的搭建
9.2.6 视觉数据预处理
9.2.7 MindSpore中的视觉数据预处理
9.2.8 自动微分与反向传播算法
9.2.9 AI中的关键技术
9.2.10 深度神经网络训练
9.2.11 MindSpore实现深度神经网络训练
9.3.1 基于ResNet50的图像分类
9.3.2 MindSpore实现基于ResNet50的图像分类
9.4.1 基于U-Net的图像分割
9.4.2 MindSpore实现基于U-Net的图像分割
9.5.1 GAN生成对抗网络
9.5.2 MindSpore实现GAN生成对抗网络
9.6.1 基于Yolov5的目标检测
9.6.2 MindSpore实现基于Yolov5的目标检测
9.6.3 基于SSD的目标检测
9.6.4 MindSpore实现基于SSD的目标检测
9.7.1 端云协同视觉应用部署
9.7.2 端云协同移动部署
展开全部
预备知识
证书要求
为积极响应国家低碳环保政策, 2021年秋季学期开始,中国大学MOOC平台将取消纸质版的认证证书,仅提供电子版的认证证书服务,证书申请方式和流程不变。
电子版认证证书支持查询验证,可通过扫描证书上的二维码进行有效性查询,或者访问 https://www.icourse163.org/verify,通过证书编号进行查询。学生可在“个人中心-证书-查看证书”页面自行下载、打印电子版认证证书。
完成课程教学内容学习和考核,成绩达到课程考核标准的学生(每门课程的考核标准不同,详见课程内的评分标准),具备申请认证证书资格,可在证书申请开放期间(以申请页面显示的时间为准),完成在线付费申请。
认证证书申请注意事项:
1. 根据国家相关法律法规要求,认证证书申请时要求进行实名认证,请保证所提交的实名认证信息真实完整有效。
2. 完成实名认证并支付后,系统将自动生成并发送电子版认证证书。电子版认证证书生成后不支持退费。
参考资料
[1] 《卷积神经网络与计算机视觉》,[澳] 萨尔曼·汗(Salman Khan)等编,机械工业出版社,2019年;
[2]《计算机视觉教程》,(第二版)章毓晋编,人民邮电出版社,2017年;
[3]《计算机视觉:模型、学习和推理》,[英] 西蒙 J.D. 晋林斯编,机械工业出版社,2017年。