吃透大模型技术基础：从语言理解到生成智能-苏嘉昊AI博士-知识小课

发现课程

专家讲师成为讲师企业版全球版

吃透大模型技术基础：从语言理解到生成智能

¥119

会员免费学习

单独购买

你将收获

完整掌握 NLP 演进全链路，顺着九大模块梳理行业技术发展史，吃透从 Word2Vec、传统神经网络到 Seq2Seq、Transformer 的迭代逻辑
吃透大模型核心底层原理，弄懂注意力机制、预训练逻辑、文本表征与内容生成机理，理清各类主流大模型技术架构差异。
具备模型拆解落地能力，能够动手拆解重构模型，结合上下文原理优化业务提示词，依托底层知识优化自家 AI 落地项目效果。

浏览相关主题

课程介绍

你是否曾思考：

日常调用大模型接口做业务开发，却看不懂底层运行逻辑，出现效果异常无从排查？

只会使用现成大模型，不了解NLP技术迭代脉络，选型架构、优化方案全凭经验试错？

想要自主拆解、微调模型，却卡在Word2Vec、Transformer等核心原理，缺少系统化学习路径？

如果这些问题让你感到紧迫，这门课正是为你设计！大模型应用离不开底层理论支撑，从自然语言基础到大模型生成逻辑是一套完整的技术体系。掌握它，告别只会调用不懂原理的浅层应用，从底层看懂、用好、优化大模型。

本课程按照技术演进顺序，由浅入深逐层拆解大模型全链路知识：

从基石篇入门NLP基础概念，弄懂机器理解人类语言的表征原理；

循序渐进学习Word2Vec词向量工程落地、传统神经网络演化短板、Seq2Seq与注意力机制迭代；

深入解析Transformer架构、预训练模型底层逻辑，亲手拆解重构大模型，最后吃透文本生成原理与上下文潜能使用技巧。

讲师背景：NLP与大模型研发实战导师

深耕自然语言处理与大模型底层研发，拥有多年一线项目落地经验，顺着技术发展脉络拆解理论，弱化晦涩数学堆砌、偏重原理+工程实战，贴合研发人员落地学习需求。

通过本课程，学员将：

系统梳理NLP完整技术发展史，建立从词嵌入到Transformer的完整知识框架，理清技术迭代逻辑；

吃透预训练、注意力机制、大模型生成机理等核心底层原理，看懂主流大模型架构设计思路；

具备模型拆解重构能力，依托上下文原理优化业务落地策略，精准定位大模型应用故障、优化项目落地效果。

用好大模型的前提，是读懂大模型。你，准备好夯实底层功底，吃透大模型核心原理了吗？

适合人群

算法工程师
NLP 研发工程师
AI 应用开发、后端研发工程师

讲师介绍

苏嘉昊AI博士查看讲师主页

500强企业算法专家、中国科学院大学博士

擅长领域:

DeepSeek
AIGC办公提效
大语言模型
AIGC行业应用
数字化战略

苏嘉昊，中国科学院大学博士，高级职称资深研究员，中国计算机学会高级会员。现任世界500强企业高级算法专家，兼任清华、北大、国科大等高校讲座导师。深耕人工智能领域14年，长期专注于大语言模型、深度学习、推荐系统等核心方向，兼具前沿技术研究能力与复杂业务场景落地经验。曾主导多项重大AI产品与项目从0到1、从技术验证到业务落地，累计创造经济效益超10亿元。长期为世界500强及政府机构提供AI培训与技术咨询，授课理论实战结合、深入浅出，广受学员认可，能够帮助学员快速建立系统认知并提升实战能力。

课程大纲

共0节时长0分钟全部收起

第一节基石篇：走进 NLP 的数字世界

8分钟

第二节表征篇：机器如何读懂人类语言

8分钟

第三节投影篇：Word2Vec 原理与工程实战

9分钟

第四节记忆篇：传统神经网络的进化与瓶颈

7分钟

第五节觉醒篇：从Seq2Seq 到Attention的范式转移

7分钟

第六节颠覆篇：Transformer 架构解析

8分钟

第七节流派篇：预训练原理

9分钟

第八节硬核篇：亲手拆解与重构大语言模型

8分钟

第九节终极篇：生成机理与上下文潜能激发

9分钟

购课须知

课程有效期：

自购买课程之日起 365 天，部分参与营销活动产品以活动规则为准，请同学在有效期内学习、观看课程。

上课模式：

课程采取录播模式，请注意自学课无班级微信群、班主任带班及助教批改服务。

注：自学课不支持退款，确保你是真的需要再进行报名，报完名之后还请认真学习。

点击下载
三节课App 微信扫码
关注三节课公众号