清科教育,权威师资服务平台

秦曾昌《深度学习与大语言模型的理论与实践》

12 阅读 0 点赞 更新日期:2026-04-13
授课老师: 秦曾昌
常驻地:北京
擅长领域: AI数字化

🎯 从理论到实践——深度学习与大语言模型完整进阶路径

秦曾昌教授《深度学习与大语言模型的理论与实践》课程,系统讲解机器学习基础、深度学习模型(CNN、RNN、LSTM)、AIGC与深度生成模型(GAN、Diffusion)、大语言模型(Transformer、注意力机制、提示工程)等内容,帮助学员掌握AI2.0时代核心技术。

秦曾昌

深度学习与大语言模型的理论与实践

课程简介

深度学习是人工智领域最活跃的分支领域之一,是人工智能的研究中最核心的一部分。与传统的严格静态编程指令不同,机器学习算法根据数据输入构建模型并由数据驱动的来进行预测与分析。深度学习在机器视觉、自然语言处理、推荐搜索等领域都有广泛的应用。尤其在近些年自然语言大模型与AIGC人工智能生成内容方面的进展使人工智能技术有了更多的应用场景。本课程将从底层介绍基本的机器学习与深度学习模型,了解普通的前馈神经网络,卷积神经网络(CNN),长短记忆网络(LSTM)到Transformer的发展逻辑,并通过一些实践样例,提供实践技巧。并了解到一些最新关于深度学习理论和应用的内容,并学会搭建环境与使用公开的大模型。

目标收益

1. 解释深度学习理论

2. 介绍普通机器学习到深度学习的差别

3. 深度学习经典的模型与应用

4. 深度生成模型(GAN, VAE)

5. 大语言模型(LLM)与应用

培训对象

1. 开发者

2. 架构师

3. 测试工程师

4. 研究工程师

课程大纲

课时一:机器学习、深度学习基本概念

主要内容:深度学习介绍

1)机器学习的基本哲学

2)线性模型,广义线性模型

3. 神经网络与感知器

4. 反向传播算法(BP)

5) 神经网络模型的普适性

课时二:深度学习模型与应用案例

主要内容:对基本深度学习算法的原理与应用进行介绍

1)卷积神经网络(CNN)

2)卷积神经网络在机器视觉中的应用任务

3)循环神经网络 (RNN)

5. 长短记忆网络(LSTM)

5) seq2seq 模型与资源语言处理任务

6. 文本生成实验

课时三:AIGC与深度生成模型

主要内容:AIGC与深度生成模型

1)隐含变量(Latent Variable)

2)混合模型(Mixture Model)

3)高斯混合模型(Gaussian Mixture Model)

4)对抗生成网络(GAN)的基本原理

5) Diffusion 模型与应用

课时四:自然语言大模型与AI 2.0

主要内容:本课时主要介绍大语言模型基本原理与方法,了解AI2.0技术发展趋势

1)注意力机制

2) Transformer 模型

3) 大语言模型的哲学

4) 提示工程(Prompt Engineering)

5) 大语言模型的部署与实践

授课老师简介

秦曾昌 北京航空航天大学教授,曾任Keep首席科学家、人工智能研究院院长

常驻地:北京

邀请授课:13911448898 谷老师

主讲课程: 人工智能、从Deepseek看人工智能新趋势、深度学习详解、可计算的奇幻想象-计算、智能元宇宙、深度学习与大语音模型的理论与实践等

微信扫一扫

T:13911448898

立即
报名
返回
顶部