你是否曾思考:
大模型参数量过大,显存占用高,无法在端侧与边缘设备部署?
面对剪枝、蒸馏、量化三类压缩技术,不知如何选型与落地?
想做低比特量化,却担心精度损失严重、推理效果不稳定?
如果这些问题让你感到紧迫,这门课正是为你设计!大模型压缩是端侧部署的核心环节,直接决定模型能否在低资源环境高效运行。
本课程围绕目标认知、技术拆解、实战落地三大主线展开:
目标认知:明确大模型压缩的核心目标与效果约束条件;
技术拆解:系统讲解剪枝、知识蒸馏、量化三类压缩方法的原理、分类与优缺点;
实战落地:聚焦主流量化方案,掌握 AWQ、GPTQ、GGUF 等实操流程与工具使用。
讲师背景:资深企业内训讲师
李晓华老师深耕一线,拥有近15年项目开发与团队管理实战经验,精通人工智能算法及应用,对AI技术落地业务场景有着深刻且独到的理解;教育背景深厚,兼具扎实学术功底与前沿国际视野;深谙学员与企业核心痛点,擅长引导学员思考、对症下药,所有培训均秉承“听得懂 + 学得会 + 用得上”核心原则,助力学员短期内快速提升AI实战能力,让技术真正落地业务、创造价值。
通过本课程,学员将:
体系认知:建立大模型压缩完整知识框架,理解三类技术的适用场景与局限;
技术掌握:熟练掌握剪枝、蒸馏、量化的核心原理与实现逻辑;
实战落地:具备独立完成大模型量化部署的能力,实现显存优化与推理加速。
立即加入学习,掌握大模型压缩实战技能,实现端侧高效部署!
课程有效期:
自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。
上课模式:
课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。
注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。