你是否曾思考过:
通用大模型在业务场景中表现不佳,如何用私有数据提升模型效果?
行业模型真的比通用模型更适用吗?何时该用RAG,何时该做微调?
从预训练到偏好优化,如何低成本、高效率地完成全流程实操?
如果这些问题让你感到紧迫,这门课正是为你设计的。本课程不空谈概念,而是围绕“环境搭建—三阶段微调—效果验证”的完整链路,提供可直接上手的操作指引。
本课程围绕三大实操阶段展开:
阶段一:预训练 – 了解无监督文本数据格式与训练损失控制(损失降至0.5左右)。
阶段二:监督微调(SFT) – 掌握指令数据格式、LoRA目标模块配置,以及“私有数据+公共数据”的混合策略。
阶段三:偏好优化(PPO/DPO) – 学会构建“优质回答/劣质回答”数据对,优化模型输出偏好。
同时覆盖环境搭建与核心认知:
软件环境:Ubuntu 22.04/24.04、CUDA≥12.2、Python≥3.10
工具安装:LLaMA-Factory源码安装、WebUI启动命令
决策逻辑:先尝试RAG,解决不好再考虑微调;微调前明确“模型哪里表现不好”及“是否有私有数据”
讲师背景:
李晓华,大模型微调实战讲师,聚焦模型定制化落地,提倡“测试驱动微调”,帮助技术人员以更低硬件门槛(单卡可运行)完成行业模型适配。
通过本课程,学员将:
1. 掌握核心实操:独立完成从环境配置到三阶段微调的完整流程,输出可用的微调数据与模型。
2. 建立决策框架:清晰判断何时用预训练、SFT还是偏好优化,避免盲目微调。
3. 提升岗位价值:为中大型企业定制内部专用模型,降低对通用API的依赖,强化数据安全与业务贴合度。
> 朴素的认知:大模型公司做通用底座,行业公司微调行业模型。而微调不是“显得水平高”,是解决真实业务痛点。你,准备好动手了吗?
课程有效期:
自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。
上课模式:
课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。
注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。