自然语言处理(natural language processing, NLP)是人工智能的一个重要分支,研究算法如何自动的理解和生成人类语言。近些年,自然语言处理受到了越来越多的关注,从智能检索到智能翻译、智能音箱、GPT等模型的影响十分广泛。
自然语言处理背后的基本技术是机器学习,自然语言的特性使得自然语言处理领域的机器学习技术具有自身的重要特点,而这些特点,也为整个机器学习领域的发展提供了重要贡献。理解自然语言处理背后的机器学习基础,为深入理解语言处理技术,灵活应用相关模型工具,进行研究和技术创新提供必要条件。
本课程以机器学习理论和模型算法为核心,介绍自然语言处理技术基础。本课程适合高年级的相关专业本科生,和从事相关方向研究的硕士生和博士生。学习本课程之后,学生可以掌握自然语言处理领域的关键数学基础,轻松阅读前沿科技文献,具备深入模型设计和创新的基本条件。
掌握基础自然语言处理数学模型,深入理解领域前沿技术,具备阅读自然语言处理领域最新论文的必要知识,具备调整模型和技术创新的基础知识。
预备知识:线性代数、微积分、概率论、算法基础。如果了解数值分析(第3章、第13章、第14章)、泛函分析(第4章)、信息论(第5章),会使相关章节部分内容的学习更加轻松。
Q : 本课程的考试方式是怎样的?
A : 本课程不设期末考试,通过习题和编程两种方式进行积分,以累计分数为最终评价标准。
Q : 我在学习课程的过程中是否需要编程?
A : 本课程以讲授数学建模知识为主,可以通过课后习题或者编程的方式通过考核。因此纯理论学习也可以优秀地通过本课程,但强烈建议有条件的同学进行相应编程。
Q : 我需要怎样的电脑才能完成课程的相应编程练习?
A : 一个具有基本配置的个人电脑即可完成自然语言处理课程的大部分编程练习,推荐:
Q : 本课程的内容对我来说比较多,能否选择其中的一部分重点学习?
A : 根据时间和精力,本课程的第9章,第12章,第18章,以及第15章对应第9章的内容可以作为选修部分。完成这些部分的同学可以得到额外分数。
Q : 是否必须阅读英文版教材?
A : 不必须。幻灯片讲义里包含了尽可能多的细节。同学们可以根据讲授内容自己做笔记。本书中文版尚未推出。