认证学习
自然语言处理
分享
课程详情
课程评价
spContent=西湖大学张岳教授的自然语言处理课程上线中国大学慕课! 自然语言处理(NLP)是人工智能的一个重要分支,研究算法如何自动的理解和生成人类语言。本课程以机器学习理论和模型算法为核心,介绍自然语言处理技术基础。本课程适合高年级的相关专业本科生,和从事相关方向研究的硕士生和博士生。学习本课程之后,学生可以掌握自然语言处理领域的关键数学基础,轻松阅读前沿科技文献,具备深入模型设计和创新的基本条件。 张岳,西湖大学长聘教授。2003年毕业于清华大学计算机科学专业,获得学士学位;2006年毕业于牛津大学计算机科学专业,获得硕士学位;2009年毕业于牛津大学计算机科学专业,获得博士学位。2010年3月-2012年6月在剑桥大学计算机科学专业从事博士后研究。2012年7月-2018年8月在新加坡科技与设计大学担任助理教授。2017年3月起担任新加坡国立大学商学院荣誉研究员。2018年9月全职加入西湖大学工学院。 目前谷歌学术引用量超过1.6万次,H因子68。
—— 课程团队
课程概述

自然语言处理(natural language processing, NLP)是人工智能的一个重要分支,研究算法如何自动的理解和生成人类语言。近些年,自然语言处理受到了越来越多的关注,从智能检索到智能翻译、智能音箱、GPT等模型的影响十分广泛。


自然语言处理背后的基本技术是机器学习,自然语言的特性使得自然语言处理领域的机器学习技术具有自身的重要特点,而这些特点,也为整个机器学习领域的发展提供了重要贡献。理解自然语言处理背后的机器学习基础,为深入理解语言处理技术,灵活应用相关模型工具,进行研究和技术创新提供必要条件。


本课程以机器学习理论和模型算法为核心,介绍自然语言处理技术基础。本课程适合高年级的相关专业本科生,和从事相关方向研究的硕士生和博士生。学习本课程之后,学生可以掌握自然语言处理领域的关键数学基础,轻松阅读前沿科技文献,具备深入模型设计和创新的基本条件。

授课目标

掌握基础自然语言处理数学模型,深入理解领域前沿技术,具备阅读自然语言处理领域最新论文的必要知识,具备调整模型和技术创新的基础知识。

课程大纲
预备知识

预备知识:线性代数、微积分、概率论、算法基础。如果了解数值分析(第3章、第13章、第14章)、泛函分析(第4章)、信息论(第5章),会使相关章节部分内容的学习更加轻松。

参考资料
  • 张岳,滕志扬,《Natural Language Processing - A Machine Learning Perspective》,剑桥大学出版社,2021年,ISBN-10 1108420214
  • Jurafsky, D., Martin, J. (2020) Speech and Language Processing, 3rd Edition. 
常见问题

Q : 本课程的考试方式是怎样的?

A :  本课程不设期末考试,通过习题和编程两种方式进行积分,以累计分数为最终评价标准。

Q : 我在学习课程的过程中是否需要编程?

A :  本课程以讲授数学建模知识为主,可以通过课后习题或者编程的方式通过考核。因此纯理论学习也可以优秀地通过本课程,但强烈建议有条件的同学进行相应编程。

Q : 我需要怎样的电脑才能完成课程的相应编程练习?

A :  一个具有基本配置的个人电脑即可完成自然语言处理课程的大部分编程练习,推荐:

  • 处理器:推荐具有i5或以上配置;
  • 内存:推荐8GB或以上;
  • 硬盘:推荐有256GB的存储空间;
  • 显卡:若需要使用GPU加速,请选择Nvidia GPU;
  • 操作系统:推荐使用Windows 10或Ubuntu 20.04及以上版本;
  • 开发环境:请安装Anaconda,以及相关的Python库,如NumPy,Pandas,Matplotlib,PyTorch等。

Q : 本课程的内容对我来说比较多,能否选择其中的一部分重点学习?

A :  根据时间和精力,本课程的第9章,第12章,第18章,以及第15章对应第9章的内容可以作为选修部分。完成这些部分的同学可以得到额外分数。

Q : 是否必须阅读英文版教材?

A :  不必须。幻灯片讲义里包含了尽可能多的细节。同学们可以根据讲授内容自己做笔记。本书中文版尚未推出。