🤖 从深度学习到大模型——智能体技术全景进阶
秦曾昌教授《深度学习、大模型与智能体》课程,系统讲解深度学习基础(神经网络、CNN、反向传播)、大模型架构(Transformer、GPT、BERT、DeepSeek、CLIP)以及智能体与强化学习(Q-learning、DQN)。帮助学员建立从底层原理到前沿应用的技术视野。
秦曾昌
深度学习、大模型与智能体
第一部分:深度学习基础(3小时)
深度学习简介 (30分钟)
1. 什么是深度学习?
2. 深度学习的历史背景和发展
3. 深度学习与传统机器学习的区别
神经网络基础 (1小时)
1. 神经网络的基本结构(感知机、多层感知机)
2. 激活函数(ReLU、Sigmoid等)
3. 反向传播算法
卷积神经网络(CNN) (1小时)
1. CNN的基本概念与原理
2. 卷积层、池化层、全连接层
3. 常见CNN架构(如LeNet、VGG、ResNet)
训练与优化 (30分钟)
1. 梯度下降与优化方法(SGD、Adam等)
2. 正则化与避免过拟合
第二部分:大模型与智能体(3小时)
大模型的挑战与应用 (1小时)
1. 大模型的定义与特点
2. GPT、BERT等大型预训练模型的架构与应用
3. DeepSeek 的推理模型
4. CLIP跨模态大模型
5. 训练大模型的技术挑战(计算资源、数据等)
智能体与强化学习 (1小时)
1. 强化学习基本概念:奖励、策略、值函数
2. Q-learning与深度Q网络(DQN)
3. 训练智能体的环境与算法
两天 12 小时(第二版课程大纲)
第一天:深度学习基础与大模型概念
深度学习与神经网络基础 (2小时)
1. 神经网络基础概念及其工作原理
2. 反向传播算法详解
3. 常用激活函数与优化算法
卷积神经网络(CNN)深入探讨 (2小时)
1. CNN的层次结构与工作机制
2. 各种CNN架构解析(ResNet、Inception等)
3. CNN在图像处理中的应用案例
大模型的背景与发展 (2小时)
1. 从传统模型到大模型的过渡
2. Transformer模型、MOE模型
3. BERT、GPT、DeepSeek等大模型的架构
4. 预训练与微调技术
第二天(6小时):智能体与深度强化学习
强化学习基础 (2小时)
1. 强化学习的核心概念(奖励、策略、值函数)
2. 常见算法:Q-learning、Policy Gradient等
3. 案例分析:如何使用强化学习解决实际问题
深度强化学习 (2小时)
1. DQN、A3C等深度强化学习算法
2. 深度学习与强化学习的结合
3. 实际应用:自适应学习与自主决策系统
前沿技术与大模型在智能体中的应用 (2小时)
1. 大模型如何支持智能体的复杂任务
2. 自然语言处理与智能体的结合
3. 前沿案例:如OpenAI、DeepMind的成功应用

