大模型部署压缩技术全解析:剪枝、蒸馏与量化实战

大模型部署压缩技术全解析:剪枝、蒸馏与量化实战

精简参数量,降低内存和显存消耗,实现端侧与边缘设备的高效大模型部署

¥69
本课程包括
  • 1小时52分钟的视频随时观看
  • 可在APP随时观看
  • 结业证书
你将收获
  • 明确压缩核心指标,在精度与资源消耗间找到平衡方案
  • 吃透剪枝、蒸馏、量化原理,可根据场景合理选择压缩方案
  • 掌握主流量化工具与实操流程,完成模型轻量化部署
浏览相关主题
课程介绍

你是否曾思考:

大模型参数量过大,显存占用高,无法在端侧与边缘设备部署?

面对剪枝、蒸馏、量化三类压缩技术,不知如何选型与落地?

想做低比特量化,却担心精度损失严重、推理效果不稳定?

如果这些问题让你感到紧迫,这门课正是为你设计!大模型压缩是端侧部署的核心环节,直接决定模型能否在低资源环境高效运行。

本课程围绕目标认知、技术拆解、实战落地三大主线展开:

  • 目标认知:明确大模型压缩的核心目标与效果约束条件;

  • 技术拆解:系统讲解剪枝、知识蒸馏、量化三类压缩方法的原理、分类与优缺点;

  • 实战落地:聚焦主流量化方案,掌握 AWQ、GPTQ、GGUF 等实操流程与工具使用。

讲师背景:资深企业内训讲师

李晓华老师深耕一线,拥有近15年项目开发与团队管理实战经验,精通人工智能算法及应用,对AI技术落地业务场景有着深刻且独到的理解;教育背景深厚,兼具扎实学术功底与前沿国际视野;深谙学员与企业核心痛点,擅长引导学员思考、对症下药,所有培训均秉承“听得懂 + 学得会 + 用得上”核心原则,助力学员短期内快速提升AI实战能力,让技术真正落地业务、创造价值。

通过本课程,学员将:

  1. 体系认知:建立大模型压缩完整知识框架,理解三类技术的适用场景与局限;

  2. 技术掌握:熟练掌握剪枝、蒸馏、量化的核心原理与实现逻辑;

  3. 实战落地:具备独立完成大模型量化部署的能力,实现显存优化与推理加速。

立即加入学习,掌握大模型压缩实战技能,实现端侧高效部署!

适合人群
  • 大模型开发者、算法工程师、深度学习从业者,需要解决模型部署资源受限问题
  • 端侧与边缘设备研发人员,希望将大模型落地到低算力硬件的技术人员
  • 入门大模型工程化,想系统学习压缩与部署技术的学习者与研发爱好者
讲师介绍
美国金门大学博士/北京大学硕士
擅长领域:
  • AIGC办公提效
  • 大语言模型
  • DeepSeek
  • 人工智能认知与应用
  • 数据思维
  • AIGC行业应用
  • 自然语言处理(NLP)
  • 深度学习
  • 机器学习
  • 计算机视觉
技术老兵,在一线从事项目开发和团队管理近15年;精通人工智能算法及应用;线上教学视频每年的播放量在1000万人次以上;累计培养付费学员数万人;在企业培训方面,每年培训至少80家大型央企、国企和外企(如:中国移动、中国联通、中国电信、中国石油、中科曙光、中电金信、中国管理科学研究院、中国移动设计院、中国铁塔研究院、中国铁路、华润集团、友邦、光大银行、广发银行、中信银行、杭州银行、国泰君安、奔驰汽车、康宁、富士康、东风岚图、日本横河电机、同济大学、浙江财经大学、安徽工业大学、北京信息科技大学、陕西国防学院、北京大数据研究院等);学术大会公开演讲累计数百场(线上+线下);深刻理解学员和企业存在的问题,擅长引导学员思考,对症下药;所有培训秉承【听得懂+学得会+用得上】的原则,短期内迅速提升实战能力!
课程大纲
共0节 时长0分钟 全部收起
第一章 大模型压缩的目标
5分钟
第二章 压缩技术1:剪枝
6分钟
第三章 压缩技术2:蒸馏
7分钟
第四章 压缩技术3:量化
30分钟
第五章 大模型量化实战
共2节 | 50分钟
  • 第一节 实操演示(上)
    28分钟
  • 第二节 实操演示(下)
    23分钟
课程总结
14分钟
附件
图文
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。