🎯 从理论到实践——深度学习与大语言模型完整进阶路径
秦曾昌教授《深度学习与大语言模型的理论与实践》课程,系统讲解机器学习基础、深度学习模型(CNN、RNN、LSTM)、AIGC与深度生成模型(GAN、Diffusion)、大语言模型(Transformer、注意力机制、提示工程)等内容,帮助学员掌握AI2.0时代核心技术。
秦曾昌
深度学习与大语言模型的理论与实践
课程简介
深度学习是人工智领域最活跃的分支领域之一,是人工智能的研究中最核心的一部分。与传统的严格静态编程指令不同,机器学习算法根据数据输入构建模型并由数据驱动的来进行预测与分析。深度学习在机器视觉、自然语言处理、推荐搜索等领域都有广泛的应用。尤其在近些年自然语言大模型与AIGC人工智能生成内容方面的进展使人工智能技术有了更多的应用场景。本课程将从底层介绍基本的机器学习与深度学习模型,了解普通的前馈神经网络,卷积神经网络(CNN),长短记忆网络(LSTM)到Transformer的发展逻辑,并通过一些实践样例,提供实践技巧。并了解到一些最新关于深度学习理论和应用的内容,并学会搭建环境与使用公开的大模型。
目标收益
1. 解释深度学习理论
2. 介绍普通机器学习到深度学习的差别
3. 深度学习经典的模型与应用
4. 深度生成模型(GAN, VAE)
5. 大语言模型(LLM)与应用
培训对象
1. 开发者
2. 架构师
3. 测试工程师
4. 研究工程师
课程大纲
课时一:机器学习、深度学习基本概念
主要内容:深度学习介绍
1)机器学习的基本哲学
2)线性模型,广义线性模型
3. 神经网络与感知器
4. 反向传播算法(BP)
5) 神经网络模型的普适性
课时二:深度学习模型与应用案例
主要内容:对基本深度学习算法的原理与应用进行介绍
1)卷积神经网络(CNN)
2)卷积神经网络在机器视觉中的应用任务
3)循环神经网络 (RNN)
5. 长短记忆网络(LSTM)
5) seq2seq 模型与资源语言处理任务
6. 文本生成实验
课时三:AIGC与深度生成模型
主要内容:AIGC与深度生成模型
1)隐含变量(Latent Variable)
2)混合模型(Mixture Model)
3)高斯混合模型(Gaussian Mixture Model)
4)对抗生成网络(GAN)的基本原理
5) Diffusion 模型与应用
课时四:自然语言大模型与AI 2.0
主要内容:本课时主要介绍大语言模型基本原理与方法,了解AI2.0技术发展趋势
1)注意力机制
2) Transformer 模型
3) 大语言模型的哲学
4) 提示工程(Prompt Engineering)
5) 大语言模型的部署与实践

