大模型部署压缩技术全解析：剪枝、蒸馏与量化实战-李晓华-知识小课

发现课程

专家讲师成为讲师企业版全球版

大模型部署压缩技术全解析：剪枝、蒸馏与量化实战

¥69

立即购买

你将收获

明确压缩核心指标，在精度与资源消耗间找到平衡方案
吃透剪枝、蒸馏、量化原理，可根据场景合理选择压缩方案
掌握主流量化工具与实操流程，完成模型轻量化部署

浏览相关主题

课程介绍

你是否曾思考：

大模型参数量过大，显存占用高，无法在端侧与边缘设备部署？

面对剪枝、蒸馏、量化三类压缩技术，不知如何选型与落地？

想做低比特量化，却担心精度损失严重、推理效果不稳定？

如果这些问题让你感到紧迫，这门课正是为你设计！大模型压缩是端侧部署的核心环节，直接决定模型能否在低资源环境高效运行。

本课程围绕目标认知、技术拆解、实战落地三大主线展开：

目标认知：明确大模型压缩的核心目标与效果约束条件；
技术拆解：系统讲解剪枝、知识蒸馏、量化三类压缩方法的原理、分类与优缺点；
实战落地：聚焦主流量化方案，掌握 AWQ、GPTQ、GGUF 等实操流程与工具使用。

讲师背景：资深企业内训讲师

李晓华老师深耕一线，拥有近15年项目开发与团队管理实战经验，精通人工智能算法及应用，对AI技术落地业务场景有着深刻且独到的理解；教育背景深厚，兼具扎实学术功底与前沿国际视野；深谙学员与企业核心痛点，擅长引导学员思考、对症下药，所有培训均秉承“听得懂 + 学得会 + 用得上”核心原则，助力学员短期内快速提升AI实战能力，让技术真正落地业务、创造价值。

通过本课程，学员将：

体系认知：建立大模型压缩完整知识框架，理解三类技术的适用场景与局限；
技术掌握：熟练掌握剪枝、蒸馏、量化的核心原理与实现逻辑；
实战落地：具备独立完成大模型量化部署的能力，实现显存优化与推理加速。

立即加入学习，掌握大模型压缩实战技能，实现端侧高效部署！

适合人群

大模型开发者、算法工程师、深度学习从业者，需要解决模型部署资源受限问题
端侧与边缘设备研发人员，希望将大模型落地到低算力硬件的技术人员
入门大模型工程化，想系统学习压缩与部署技术的学习者与研发爱好者

讲师介绍

李晓华查看讲师主页

美国金门大学博士/北京大学硕士

擅长领域:

AIGC办公提效
大语言模型
DeepSeek
数据思维
AIGC行业应用

技术老兵，在一线从事项目开发和团队管理近15年；精通人工智能算法及应用；线上教学视频每年的播放量在1000万人次以上；累计培养付费学员数万人；在企业培训方面，每年培训至少80家大型央企、国企和外企（如：中国移动、中国联通、中国电信、中国石油、中科曙光、中电金信、中国管理科学研究院、中国移动设计院、中国铁塔研究院、中国铁路、华润集团、友邦、光大银行、广发银行、中信银行、杭州银行、国泰君安、奔驰汽车、康宁、富士康、东风岚图、日本横河电机、同济大学、浙江财经大学、安徽工业大学、北京信息科技大学、陕西国防学院、北京大数据研究院等）；学术大会公开演讲累计数百场（线上+线下）；深刻理解学员和企业存在的问题，擅长引导学员思考，对症下药；所有培训秉承【听得懂+学得会+用得上】的原则，短期内迅速提升实战能力！

课程大纲

共0节时长0分钟全部收起

第一章大模型压缩的目标

5分钟

第二章压缩技术1：剪枝

6分钟

第三章压缩技术2：蒸馏

7分钟

第四章压缩技术3：量化

30分钟

第五章大模型量化实战

共2节 | 50分钟