AI大模型核心技术全景解析-数知客-知识小课

发现课程

专家讲师成为讲师企业版全球版

AI大模型核心技术全景解析

¥199

会员免费学习

单独购买

你将收获

深入理解大模型核心技术
提升独立完成NLP项目的能力
掌握AI前沿应用场景
优化AI部署与成本控制

浏览相关主题

课程介绍

你是否面临这些AI技术挑战？

面对大模型技术快速发展，难以系统掌握从基础到前沿的核心原理？
在NLP任务中，对分词、注意力机制等关键技术理解不深入，影响模型效果？
缺乏对GPT、DeepSeek等主流模型的实践指导，难以高效调参和应用？

这些问题直接关系到AI项目的开发效率与效果，而本课程将帮你系统解决这些问题。

本课程由互联网大厂高级算法工程师“数知客”导师亲授，她拥有：

智能体、广告算法、搜索推荐等多领域实战经验
5项发明专利及北京市人工智能中级职称
畅销书《基于NLP内容理解》作者，人民邮电出版社专家顾问

课程三大核心模块

1. 大模型基础技术解析

Tokenization原理与实践：BPE、WordPiece、SentencePiece算法对比
Transformer架构详解：Self-Attention、多头注意力机制实现
位置编码演进：从绝对位置编码到RoPE的数学推导

2. 生成模型调优与应用

GPT技术原理：预训练、微调与提示工程实践
生成参数调优：Top-K、Top-P采样及Temperature参数联合调控
行业场景适配：代码生成、创意写作、对话系统的Prompt设计技巧

3. 前沿模型架构剖析

DeepSeek-V3混合专家模型（MoE）：稀疏激活与动态路由实现
逻辑推理优化：奖励模型与排序模型的协同训练方法
开源生态实践：Qwen模型的中文优化与多模态扩展

无论你是算法工程师、技术负责人，还是AI研究者，这门课程都将通过代码实现、参数调优案例，帮助你掌握大模型技术的核心方法论与落地工具。

现在加入，完成从理论到实战的跨越，真正掌握驱动AI革命的核心技术！

适合人群

算法工程师
技术负责人
AI研究者

讲师介绍

数知客查看讲师主页

知名大厂高级工程师

擅长领域:

AIGC行业应用
DeepSeek

互联网大厂高级算法工程师，深耕人工智能领域多年，专注于广告算法、智能体算法、生成式AI、搜索、推荐及多模态技术的研究与落地。在大模型方向拥有丰富的创新成果，已申请发明专利5项，出版畅销书《基于NLP内容理解》《玩转智能体》，并在国际期刊及会议发表人工智能相关论文2篇，具有坚实的学术积累与实践经验。作为人民邮电出版社专家顾问，积极推动人工智能技术的普及与应用。工作中，主导了“生成式广告触发”“商业智能体”等重点项目，在大模型理解、Query增强、智能体架构优化等方面提出多项创新方案，显著提升广告触发的相关性与商业价值，并在智能助手、销售Bot等场景实现规模化落地，带来可观的收益。兼具科研创新力与工程实践力，能够在复杂业务场景中推动人工智能技术的产业化应用。

课程大纲

共0节时长0分钟全部收起

先导课

4分钟

第一章分词

33分钟

第二章自注意力机制

10分钟

第三章 Transformer原理以及实现

33分钟

第四章 GPT技术原理与应用解析

共5节 | 41分钟

4.1 GPT技术概述

12分钟
4.2 GPT的工作原理

7分钟
4.3 GPT的实现技术

13分钟
4.4 GPT的应用场景

2分钟
4.5 GPT的实践指南

7分钟

第五章 Top-K采样原理详解

共5节 | 20分钟

5.1 Top-K采样概述

7分钟
5.2 Top-K采样的数学原理

2分钟
5.3 Top-K采样的关键参数

4分钟
5.4 Top-K采样的优缺点分析

3分钟
5.5 Top-K采样的实际应用

5分钟

第六章 Top-p采样原理与应用

共6节 | 23分钟

6.1 Top-p采样概述

5分钟
6.2 Top-p采样的工作原理

3分钟
6.3 Top-p采样的参数设置

4分钟
6.4 Top-p采样的优势与局限性

3分钟
6.5 Top-p采样与其他采样方法的比较

4分钟
6.6 Top-p采样的实际应用案例

4分钟

第七章 Prompt撰写方法与技巧

共5节 | 28分钟

7.1 Prompt基础概念

7分钟
7.2 Prompt设计原则

5分钟
7.3 结构化Prompt技巧

4分钟
7.4 行业场景应用

8分钟
7.5 进阶优化策略

3分钟

第八章 Temperature参数解析与应用指南

共5节 | 20分钟

8.1 Temperature参数基础概念

7分钟
8.2 参数作用机制

4分钟
8.3 不同温度值效果对比

3分钟
8.4 参数应用场景指南

3分钟
8.5 实战调参技巧

3分钟

第九章 GPT生成参数调优

共5节 | 24分钟

9.1 参数调优策略

6分钟
9.2 实际调优步骤

7分钟
9.3 典型应用场景与参数组合

3分钟
9.4 常见问题与解决方案

5分钟
9.5 总结与最佳实践

4分钟

第十章手把手带你从零推导旋转位置编码RoPE

19分钟

第十一章 DeepSeek-R1 技术全景解析

26分钟

第十二章 DeepSeek-v3 中MOE架构解析

共5节 | 34分钟

12.1 MOE发展历程

7分钟
12.2 MOE核心原理

6分钟
12.3 DeepSeek-V3中的MOE实现

11分钟
12.4 MOE关键技术挑战

4分钟
12.5 MOE模型性能优势

6分钟

第十三章不同模型的对比

13分钟

第十四章 qwen架构解读

20分钟

购课须知

课程有效期：

自购买课程之日起 365 天，部分参与营销活动产品以活动规则为准，请同学在有效期内学习、观看课程。

上课模式：

课程采取录播模式，请注意自学课无班级微信群、班主任带班及助教批改服务。

注：自学课不支持退款，确保你是真的需要再进行报名，报完名之后还请认真学习。

点击下载
三节课App 微信扫码
关注三节课公众号