大模型微调实战:从环境搭建到三阶段全链路实操

大模型微调实战:从环境搭建到三阶段全链路实操

涵盖环境搭建与三大实操阶段,助你掌握模型定制核心技术

¥69
本课程包括
  • 4小时21分钟的视频随时观看
  • 可在APP随时观看
  • 结业证书
你将收获
  • 掌握核心实操:独立完成从环境配置到三阶段微调的完整流程,输出可用的微调数据与模型
  • 建立决策框架:清晰判断何时用预训练、SFT还是偏好优化,避免盲目微调
  • 提升岗位价值:为中大型企业定制内部专用模型,降低对通用API的依赖,强化数据安全与业务贴合度
浏览相关主题
课程介绍

你是否曾思考过:

通用大模型在业务场景中表现不佳,如何用私有数据提升模型效果?

行业模型真的比通用模型更适用吗?何时该用RAG,何时该做微调?

从预训练到偏好优化,如何低成本、高效率地完成全流程实操?

如果这些问题让你感到紧迫,这门课正是为你设计的。本课程不空谈概念,而是围绕“环境搭建—三阶段微调—效果验证”的完整链路,提供可直接上手的操作指引。

本课程围绕三大实操阶段展开:

阶段一:预训练 – 了解无监督文本数据格式与训练损失控制(损失降至0.5左右)。

阶段二:监督微调(SFT) – 掌握指令数据格式、LoRA目标模块配置,以及“私有数据+公共数据”的混合策略。

阶段三:偏好优化(PPO/DPO) – 学会构建“优质回答/劣质回答”数据对,优化模型输出偏好。

同时覆盖环境搭建与核心认知:

软件环境:Ubuntu 22.04/24.04、CUDA≥12.2、Python≥3.10

工具安装:LLaMA-Factory源码安装、WebUI启动命令

决策逻辑:先尝试RAG,解决不好再考虑微调;微调前明确“模型哪里表现不好”及“是否有私有数据”

讲师背景:

李晓华,大模型微调实战讲师,聚焦模型定制化落地,提倡“测试驱动微调”,帮助技术人员以更低硬件门槛(单卡可运行)完成行业模型适配。

通过本课程,学员将:

1. 掌握核心实操:独立完成从环境配置到三阶段微调的完整流程,输出可用的微调数据与模型。

2. 建立决策框架:清晰判断何时用预训练、SFT还是偏好优化,避免盲目微调。

3. 提升岗位价值:为中大型企业定制内部专用模型,降低对通用API的依赖,强化数据安全与业务贴合度。

> 朴素的认知:大模型公司做通用底座,行业公司微调行业模型。而微调不是“显得水平高”,是解决真实业务痛点。你,准备好动手了吗?

适合人群
  • 中大型企业的AI算法工程师
  • 技术团队负责人/架构师
  • 负责企业内部AI工具落地的开发人员
讲师介绍
美国金门大学博士/北京大学硕士
擅长领域:
  • AIGC办公提效
  • 大语言模型
  • DeepSeek
  • 人工智能认知与应用
  • 数据思维
  • AIGC行业应用
  • 自然语言处理(NLP)
  • 深度学习
  • 机器学习
  • 计算机视觉
技术老兵,在一线从事项目开发和团队管理近15年;精通人工智能算法及应用;线上教学视频每年的播放量在1000万人次以上;累计培养付费学员数万人;在企业培训方面,每年培训至少80家大型央企、国企和外企(如:中国移动、中国联通、中国电信、中国石油、中科曙光、中电金信、中国管理科学研究院、中国移动设计院、中国铁塔研究院、中国铁路、华润集团、友邦、光大银行、广发银行、中信银行、杭州银行、国泰君安、奔驰汽车、康宁、富士康、东风岚图、日本横河电机、同济大学、浙江财经大学、安徽工业大学、北京信息科技大学、陕西国防学院、北京大数据研究院等);学术大会公开演讲累计数百场(线上+线下);深刻理解学员和企业存在的问题,擅长引导学员思考,对症下药;所有培训秉承【听得懂+学得会+用得上】的原则,短期内迅速提升实战能力!
课程大纲
共0节 时长0分钟 全部收起
课程附件
图文
大模型训练 vs 大模型微调
13分钟
大模型微调环境搭建
共2节 | 55分钟
  • 大模型微调环境搭建(上)
    27分钟
  • 大模型微调环境搭建(下)
    28分钟
第1阶段实操:大模型预训练
共5节 | 1小时42分钟
  • 第1阶段实操:大模型预训练(一)
    21分钟
  • 第1阶段实操:大模型预训练(二)
    24分钟
  • 第1阶段实操:大模型预训练(三)
    26分钟
  • 第1阶段实操:大模型预训练(四)
    15分钟
  • 第1阶段实操:大模型预训练(五)
    15分钟
第2阶段实操:大模型监督微调
共3节 | 58分钟
  • 第2阶段实操:大模型监督微调(一)
    19分钟
  • 第2阶段实操:大模型监督微调(二)
    19分钟
  • 第2阶段实操:大模型监督微调(三)
    19分钟
第3阶段实操:大模型偏好优化
共2节 | 33分钟
  • 第3阶段实操:大模型偏好优化(上)
    15分钟
  • 第3阶段实操:大模型偏好优化(下)
    18分钟
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。