大模型数学与算法基础入门
¥119

大模型数学与算法基础入门

AI通识课——理解反向传播、贝叶斯推理、参数寻优等关键机制的数学原理解析

¥119
本课程包括
  • 2小时24分钟的视频随时观看
  • 可在APP随时观看
  • 结业证书
你将收获
  • 夯实大模型必备数学基础:完整掌握线性代数、微积分、概率论、信息论等核心数学知识,理解每个数学概念在大模型中的实际应用,彻底摆脱数学劝退难题。
  • 吃透大模型核心算法逻辑:熟练掌握最优化、反向传播、生成采样、图论推理等核心算法,搞懂大模型训练、推理、生成的底层运作原理,能从底层定位并分析模型问题。
  • 掌握大模型落地核心技术:精通大模型对齐、量化压缩、效果评估、强化学习微调等核心落地技术,具备模型调优、优化、部署的基础算法能力,能适配工业落地场景需求。
  • 建立完整的大模型知识体系:从基础数学到前沿架构,形成完整的大模型数学与算法认知链路,能看懂行业前沿技术论文,为后续大模型深度开发、二次创新打下坚实基础。
浏览相关主题
课程介绍

你是否曾想要入局大模型赛道,却被线性代数、微积分、概率论等高门槛数学知识拦在门外,始终无法读懂模型底层算法逻辑?

日常学习仅停留在调用 API、简单运行开源项目层面,看不懂反向传播、最优化、量化压缩等核心底层原理,在调参迭代、性能优化、工程部署时处处遇阻、无从下手?

零散刷各类算法网课与教程,知识点碎片化不成完整体系,无法搭建从基础数理到前沿模型算法的连贯知识脉络,遇到故障与性能瓶颈无法从底层根源定位、解决问题?

渴望系统性夯实大模型必备数学与算法功底,却找不到零基础友好、循序渐进、紧密贴合工业落地场景的成套学习路径?

如果这些难题长期阻碍你的大模型学习进阶,这套体系课程正是为你量身打造!数学不是枯燥公式,而是读懂大模型的底层语言。吃透整套数理算法体系,你将彻底摆脱浅层调用的局限,打通理论、原理、工程落地全链路,具备模型调优、二次开发、工程部署的硬核底层能力。

本课程围绕 「从基础到前沿、从理论到落地」 核心逻辑分层落地:

升维思考:完整梳理大模型全链路所需数学根基与核心算法体系,拆解各类公式、理论在模型训练、推理、微调中的真实作用,建立完整底层认知框架;

降维工具:摒弃脱离业务的空洞数学堆砌,全部数理知识点、算法原理配套大模型实操案例,学完即可用于调参、量化、评估、架构优化等真实工作;

实战赋能:四大递进式学习模块循序渐进,覆盖基础数理、核心算法、工业落地、前沿架构全阶段,完整打通零基础入门到高阶技术进阶的成长路径,构建闭环知识体系。

四大递进式核心模块全流程拆解

一、大模型必备数学基础模块(第 1-5 章)

以大模型应用场景为导向,从核心线性代数与高维特征空间切入,系统拆解微积分与反向传播算子、概率论与贝叶斯推断、信息论与不确定性量化、非线性拓扑与激活函数空间,全覆盖支撑大模型运行的全部底层数学工具。每一个数理概念均搭配训练、推理实战场景讲解,零基础学员也能轻松吃透,彻底解决数学劝退的入门难题。

二、大模型核心算法引擎模块(第 6-10 章)

深度拆解最优化理论与参数寻优机制、计算复杂度与显存参数估算、大模型核心组件几何逻辑、图论与复杂推理网络、随机过程与生成采样算法,完整讲透模型训练、推理、文本生成的底层运行逻辑。让你彻底弄懂参数优化、算力测算、模块运转的内在原理,搭建完整、成体系的大模型算法认知。

三、大模型落地进阶技术模块(第 11-14 章)

聚焦企业工业落地刚需技术,详解强化学习马尔可夫决策框架、模型对齐与编辑高阶约束优化、统计学评估指标体系、矩阵分解与量化压缩代数,完整覆盖 RLHF 微调、模型量化压缩、效果评测、轻量化部署等核心落地技术,掌握模型优化、压缩、上线整套算法方案,完成从理论认知到工程实操能力的跨越。

四、大模型前沿架构扩展模块(第 15 章)

深度解读模型缩放法则与架构拓展背后的数学逻辑,拆解大模型扩容、架构迭代的底层规律,掌握模型规模扩张、网络结构优化的核心方法论,紧跟行业最新前沿技术,补齐高阶架构认知短板,形成完整无缺口的大模型知识闭环。

讲师背景

苏嘉昊博士深耕人工智能领域,拥有 14 年以上 AI 技术研发与团队综合管理经验,曾带队打造多款市场现象级 AI 产品,相关产品累计用户规模突破 3 亿,成果多次获央视、人民日报权威报道,同时在 WWW、AAAI、IJCAI 等人工智能国际顶会发表论文 30 余篇,兼备深厚前沿理论储备与成熟项目工程落地实战能力。长期为字节、阿里、百度、腾讯、美团、滴滴、京东、360、中国联通、国家电网、青岛啤酒等头部企业与各地政府单位提供 AI 专项培训与数字化战略咨询服务,积累跨多行业服务经验,行业影响力深厚。他擅长把晦涩复杂的 AI 技术框架拆解为通俗易懂、落地性强的学习内容,授课内容同步兼顾行业前沿趋势、企业真实业务逻辑与实战落地方法,是企业数字化内训、管理层 AI 认知升级、高端技术人才进阶进修的专业优质导师。

通过本课程,学员将:

角色升级:跳出只会调用 API 的浅层使用者身份,进阶为读懂底层数理、吃透算法原理的技术学习者,能够从根源定位模型训练、推理过程中的各类问题;

能力跃迁:掌握一套完整闭环的大模型数学 + 算法知识框架,覆盖入门数理、核心引擎、工业落地、前沿架构全板块,独立完成模型调优、量化压缩、微调对齐、架构迭代等工作;

持续竞争力:建立可自主迭代的底层知识体系,紧跟大模型前沿技术迭代节奏,依托扎实数理算法功底,持续适配 AI 开发、模型研发、工程落地等多类高薪技术岗位,构建不可替代的硬核技术壁垒。

课程核心寄语:“在大模型时代,最稀缺的不是会调用工具的使用者,而是懂底层数学、吃透算法逻辑的技术深耕者。你准备好搭建完整的大模型底层知识体系了吗?”

适合人群
  • 零基础大模型入门学习者:无数学、算法相关前置基础,想要系统入门大模型领域,从零搭建底层数学与算法知识体系的新手。
  • AI 产品、运营、业务岗从业者:日常对接大模型相关业务,想要看懂大模型底层逻辑,理解模型调优、优化的核心原理,提升业务决策与需求对接能力的职场人。
  • 初级开发、在校学生:具备基础代码能力,想要转大模型开发、算法岗,需要系统补全大模型数学与算法基础,为后续模型开发、调优、部署打下基础的技术学习者。
讲师介绍
500强企业算法专家、中国科学院大学博士
擅长领域:
  • DeepSeek
  • AIGC办公提效
  • 大语言模型
  • AIGC行业应用
  • 数字化战略
苏嘉昊,中国科学院大学博士,高级职称资深研究员,中国计算机学会高级会员。现任世界500强企业高级算法专家,兼任清华、北大、国科大等高校讲座导师。 深耕人工智能领域14年,长期专注于大语言模型、深度学习、推荐系统等核心方向,兼具前沿技术研究能力与复杂业务场景落地经验。曾主导多项重大AI产品与项目从0到1、从技术验证到业务落地,累计创造经济效益超10亿元。 长期为世界500强及政府机构提供AI培训与技术咨询,授课理论实战结合、深入浅出,广受学员认可,能够帮助学员快速建立系统认知并提升实战能力。
课程大纲
共0节 时长0分钟 全部收起
第一章:线性代数与高维特征空间
8分钟
第二章:微积分与反向传播算子
12分钟
第三章:概率论与贝叶斯推断机制
9分钟
第四章:信息论基础与不确定性量化
7分钟
第五章:非线性拓扑与激活函数空间
8分钟
第六章:最优化理论与参数寻优引擎
9分钟
第七章:计算复杂度与参数显存估算
8分钟
第八章:大模型核心组件的几何解构
8分钟
第九章:图论与复杂推理搜索网络
10分钟
第十章:随机过程与生成采样算法
11分钟
第十一章:强化学习的马尔可夫决策框架
11分钟
第十二章:对齐与编辑的高阶约束优化
12分钟
第十三章:统计学基石与评估指标计算
11分钟
第十四章:矩阵分解与量化的压缩代数
10分钟
第十五章:缩放法则与架构扩展的数学
10分钟
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。