强化学习——原理与实例精讲-唐宇迪-知识小课

发现课程

强化学习——原理与实例精讲

¥99.9

你将收获

课程介绍

强化学习是一种学习如何从状态映射到行为以使得获取的奖励最大的学习机制。这样的一个agent需要不断地在环境中进行实验，通过环境给予的反馈（奖励）来不断优化状态——行为的对应关系。因此，反复实验（trial and error）和延迟奖励（delayed reward）是强化学习最重要的两个特征。

本套强化学习课程主要包括经典算法原理讲解与案例实战两大部分。通俗讲解当下主流强化学习算法思想，结合实例解读算法整理应用流程并结合案例展开代码实战。整体风格通俗易懂，适合准备入门强化学习并进阶提升的同学们。

适合人群

讲师介绍

同济大学硕士，华东理工大学博士

擅长领域:

著有《跟着迪哥学Python数据分析与机器学习实战》，联通，移动，中信等公司特邀企业培训导师，全国高校教师培训讲师，开展线下与直播培训百余场，具有丰富的授课经验。

课程大纲

共0节时长0分钟全部收起

一、强化学习简介及其应用

共3节 | 29分钟

二、PPO算法与公式推导

共7节 | 57分钟

三、PPO实战：月球登陆器训练实例

共6节 | 49分钟

购课须知

课程有效期：

自购买课程之日起 365 天，部分参与营销活动产品以活动规则为准，请同学在有效期内学习、观看课程。

上课模式：

课程采取录播模式，请注意自学课无班级微信群、班主任带班及助教批改服务。

注：自学课不支持退款，确保你是真的需要再进行报名，报完名之后还请认真学习。