DeepSeek底层技术:Transformer原理,神经网络中的导数和梯度
知识小课

DeepSeek底层技术:Transformer原理,神经网络中的导数和梯度

  • DeepSeek

解锁深度学习,探索DeepSeek底层技术

¥79.9
本课程包括
  • 44分钟的视频随时观看
  • 可在APP随时观看
  • 结业证书
你将收获
  • 深入理解导数、梯度在模型训练中的作用,夯实AI底层知识。
  • 学会调整学习率,避免梯度消失/爆炸,提升模型收敛速度与性能。
  • 通过代码实战,快速应用数学优化方法,解决实际工程问题。
课程介绍

在当今快速发展的科技时代,人工智能(AI)已经成为推动行业变革和创新的核心力量。无论是职场人还是企业领导者,掌握AI技术都意味着在竞争中占据先机,甚至引领未来的发展方向。

为什么要学习这门课程?首先,AI技术正在深刻改变各行各业,AI的应用无处不在。掌握Transformer神经网络的核心原理,不仅能帮助你更好地理解AI的运作机制,还能为你提供开发智能应用、优化业务流程的能力。对于职场人来说,这是提升个人竞争力的关键;对于企业领导者来说,这是推动企业数字化转型的重要一步。

本课程的讲师赵栋,拥有20年的职业教育经验,曾担任FESCO职业教育总经理、达内大数据和Java培优产品线总经理,以及传智播客教育集团高级组组长。他的深厚技术背景和丰富的教学经验,确保你能够系统、高效地掌握课程内容。

通过本课程的学习,学员将掌握神经网络训练的数学原理,能够高效解决梯度消失、爆炸等常见问题,显著提升模型性能。更重要的是,学员将建立起系统的优化思维,为后续学习Transformer、BERT等复杂模型打下坚实基础。

适合人群
  • AI/机器学习工程师:希望深入理解神经网络优化原理,提升模型调优能力。
  • 计算机/数学相关专业学生:系统学习深度学习数学基础,为科研或就业做准备。
  • ​技术爱好者或转行者:零基础入门AI,掌握核心数学概念,降低学习门槛。
讲师介绍
在多家上市公司担任技术总监,深耕大模型。
擅长领域:
  • DeepSeek
  • 自然语言处理(NLP)
  • 数据分析与数据决策
  • 数字化组织赋能
  • 机器学习
  • 大语言模型
  • 数据指标体系与报表
  • 大数据系统
  • 数据治理
  • 数据挖掘与分析
曾在多家上市公司任职高级管理岗位。fesco职业教育总经理,用友新道新IT负责人,达内大数据、java培优两个产品线的负责人。在职业教育20多年,培养学生上万名。主讲课程有java体系、大数据体系、人工智能体系等内容。希望通过深入浅出的讲解大模型,可以让更多的学生理解大模型,更好的应用大模型。
课程大纲
共0节 时长0分钟 全部收起
1.最佳拟合与导数
20分钟
2.梯度与学习率:梯度
19分钟
3.梯度与学习率:学习率
5分钟
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。