大模型数学与算法基础入门-苏嘉昊AI博士-知识小课

发现课程

专家讲师成为讲师企业版全球版

大模型数学与算法基础入门

¥119

立即购买

你将收获

夯实大模型必备数学基础：完整掌握线性代数、微积分、概率论、信息论等核心数学知识，理解每个数学概念在大模型中的实际应用，彻底摆脱数学劝退难题。
吃透大模型核心算法逻辑：熟练掌握最优化、反向传播、生成采样、图论推理等核心算法，搞懂大模型训练、推理、生成的底层运作原理，能从底层定位并分析模型问题。
掌握大模型落地核心技术：精通大模型对齐、量化压缩、效果评估、强化学习微调等核心落地技术，具备模型调优、优化、部署的基础算法能力，能适配工业落地场景需求。
建立完整的大模型知识体系：从基础数学到前沿架构，形成完整的大模型数学与算法认知链路，能看懂行业前沿技术论文，为后续大模型深度开发、二次创新打下坚实基础。

浏览相关主题

课程介绍

你是否曾想要入局大模型赛道，却被线性代数、微积分、概率论等高门槛数学知识拦在门外，始终无法读懂模型底层算法逻辑？

日常学习仅停留在调用 API、简单运行开源项目层面，看不懂反向传播、最优化、量化压缩等核心底层原理，在调参迭代、性能优化、工程部署时处处遇阻、无从下手？

零散刷各类算法网课与教程，知识点碎片化不成完整体系，无法搭建从基础数理到前沿模型算法的连贯知识脉络，遇到故障与性能瓶颈无法从底层根源定位、解决问题？

渴望系统性夯实大模型必备数学与算法功底，却找不到零基础友好、循序渐进、紧密贴合工业落地场景的成套学习路径？

如果这些难题长期阻碍你的大模型学习进阶，这套体系课程正是为你量身打造！数学不是枯燥公式，而是读懂大模型的底层语言。吃透整套数理算法体系，你将彻底摆脱浅层调用的局限，打通理论、原理、工程落地全链路，具备模型调优、二次开发、工程部署的硬核底层能力。

本课程围绕 「从基础到前沿、从理论到落地」 核心逻辑分层落地：

升维思考：完整梳理大模型全链路所需数学根基与核心算法体系，拆解各类公式、理论在模型训练、推理、微调中的真实作用，建立完整底层认知框架；

降维工具：摒弃脱离业务的空洞数学堆砌，全部数理知识点、算法原理配套大模型实操案例，学完即可用于调参、量化、评估、架构优化等真实工作；

实战赋能：四大递进式学习模块循序渐进，覆盖基础数理、核心算法、工业落地、前沿架构全阶段，完整打通零基础入门到高阶技术进阶的成长路径，构建闭环知识体系。

四大递进式核心模块全流程拆解

一、大模型必备数学基础模块（第 1-5 章）

以大模型应用场景为导向，从核心线性代数与高维特征空间切入，系统拆解微积分与反向传播算子、概率论与贝叶斯推断、信息论与不确定性量化、非线性拓扑与激活函数空间，全覆盖支撑大模型运行的全部底层数学工具。每一个数理概念均搭配训练、推理实战场景讲解，零基础学员也能轻松吃透，彻底解决数学劝退的入门难题。

二、大模型核心算法引擎模块（第 6-10 章）

深度拆解最优化理论与参数寻优机制、计算复杂度与显存参数估算、大模型核心组件几何逻辑、图论与复杂推理网络、随机过程与生成采样算法，完整讲透模型训练、推理、文本生成的底层运行逻辑。让你彻底弄懂参数优化、算力测算、模块运转的内在原理，搭建完整、成体系的大模型算法认知。

三、大模型落地进阶技术模块（第 11-14 章）

聚焦企业工业落地刚需技术，详解强化学习马尔可夫决策框架、模型对齐与编辑高阶约束优化、统计学评估指标体系、矩阵分解与量化压缩代数，完整覆盖 RLHF 微调、模型量化压缩、效果评测、轻量化部署等核心落地技术，掌握模型优化、压缩、上线整套算法方案，完成从理论认知到工程实操能力的跨越。

四、大模型前沿架构扩展模块（第 15 章）

深度解读模型缩放法则与架构拓展背后的数学逻辑，拆解大模型扩容、架构迭代的底层规律，掌握模型规模扩张、网络结构优化的核心方法论，紧跟行业最新前沿技术，补齐高阶架构认知短板，形成完整无缺口的大模型知识闭环。

讲师背景

苏嘉昊博士深耕人工智能领域，拥有 14 年以上 AI 技术研发与团队综合管理经验，曾带队打造多款市场现象级 AI 产品，相关产品累计用户规模突破 3 亿，成果多次获央视、人民日报权威报道，同时在 WWW、AAAI、IJCAI 等人工智能国际顶会发表论文 30 余篇，兼备深厚前沿理论储备与成熟项目工程落地实战能力。长期为字节、阿里、百度、腾讯、美团、滴滴、京东、360、中国联通、国家电网、青岛啤酒等头部企业与各地政府单位提供 AI 专项培训与数字化战略咨询服务，积累跨多行业服务经验，行业影响力深厚。他擅长把晦涩复杂的 AI 技术框架拆解为通俗易懂、落地性强的学习内容，授课内容同步兼顾行业前沿趋势、企业真实业务逻辑与实战落地方法，是企业数字化内训、管理层 AI 认知升级、高端技术人才进阶进修的专业优质导师。

通过本课程，学员将：

角色升级：跳出只会调用 API 的浅层使用者身份，进阶为读懂底层数理、吃透算法原理的技术学习者，能够从根源定位模型训练、推理过程中的各类问题；

能力跃迁：掌握一套完整闭环的大模型数学 + 算法知识框架，覆盖入门数理、核心引擎、工业落地、前沿架构全板块，独立完成模型调优、量化压缩、微调对齐、架构迭代等工作；

持续竞争力：建立可自主迭代的底层知识体系，紧跟大模型前沿技术迭代节奏，依托扎实数理算法功底，持续适配 AI 开发、模型研发、工程落地等多类高薪技术岗位，构建不可替代的硬核技术壁垒。

课程核心寄语：“在大模型时代，最稀缺的不是会调用工具的使用者，而是懂底层数学、吃透算法逻辑的技术深耕者。你准备好搭建完整的大模型底层知识体系了吗？”

适合人群

零基础大模型入门学习者：无数学、算法相关前置基础，想要系统入门大模型领域，从零搭建底层数学与算法知识体系的新手。
AI 产品、运营、业务岗从业者：日常对接大模型相关业务，想要看懂大模型底层逻辑，理解模型调优、优化的核心原理，提升业务决策与需求对接能力的职场人。
初级开发、在校学生：具备基础代码能力，想要转大模型开发、算法岗，需要系统补全大模型数学与算法基础，为后续模型开发、调优、部署打下基础的技术学习者。

讲师介绍

苏嘉昊AI博士查看讲师主页

500强企业算法专家、中国科学院大学博士

擅长领域:

DeepSeek
AIGC办公提效
大语言模型
AIGC行业应用
数字化战略

苏嘉昊，中国科学院大学博士，高级职称资深研究员，中国计算机学会高级会员。现任世界500强企业高级算法专家，兼任清华、北大、国科大等高校讲座导师。深耕人工智能领域14年，长期专注于大语言模型、深度学习、推荐系统等核心方向，兼具前沿技术研究能力与复杂业务场景落地经验。曾主导多项重大AI产品与项目从0到1、从技术验证到业务落地，累计创造经济效益超10亿元。长期为世界500强及政府机构提供AI培训与技术咨询，授课理论实战结合、深入浅出，广受学员认可，能够帮助学员快速建立系统认知并提升实战能力。

课程大纲

共0节时长0分钟全部收起

第一章：线性代数与高维特征空间

8分钟

第二章：微积分与反向传播算子

12分钟

第三章：概率论与贝叶斯推断机制

9分钟

第四章：信息论基础与不确定性量化

7分钟

第五章：非线性拓扑与激活函数空间

8分钟

第六章：最优化理论与参数寻优引擎

9分钟

第七章：计算复杂度与参数显存估算

8分钟

第八章：大模型核心组件的几何解构

8分钟

第九章：图论与复杂推理搜索网络

10分钟

第十章：随机过程与生成采样算法

11分钟

第十一章：强化学习的马尔可夫决策框架

11分钟

第十二章：对齐与编辑的高阶约束优化

12分钟

第十三章：统计学基石与评估指标计算

11分钟

第十四章：矩阵分解与量化的压缩代数

10分钟

第十五章：缩放法则与架构扩展的数学

10分钟

购课须知

课程有效期：

自购买课程之日起 365 天，部分参与营销活动产品以活动规则为准，请同学在有效期内学习、观看课程。

上课模式：

课程采取录播模式，请注意自学课无班级微信群、班主任带班及助教批改服务。

注：自学课不支持退款，确保你是真的需要再进行报名，报完名之后还请认真学习。

点击下载
三节课App 微信扫码
关注三节课公众号