强化学习：原理与Python实战最新章节全文无弹窗在线阅读-QQ阅读女频青春网

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面，深入介绍了主流强化学习理论和算法，覆盖资格迹等经典算法和MuZero等深度强化学习算法；实战方面，每章都配套了编程案例，以方便读者学习。全书从逻辑上分为三部分。第1章：从零开始介绍强化学习的背景知识，介绍环境库Gym的使用。第2～15章：基于折扣奖励离散时间Markov决策过程模型，介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论，进而在理论的基础上讲解算法，并为算法提供配套代码实现。基础理论的讲解突出主干部分，算法讲解全面覆盖主流的强化学习算法，包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应，还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章：介绍其他强化学习模型，包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等，以便更好了解强化学习研究的全貌。

品牌：机械工业出版社

上架时间：2023-08-01 00:00:00

出版社：机械工业出版社

本书数字版权由机械工业出版社提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清

主页

会员
强化学习：原理与Python实现
全书分为三个部分。第一部分了解强化学习应用，了解强化学习基本知识，搭建强化学习测试环境。该部分包括：强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分：Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论；深度强化学习算法部分：详细剖析全部具有重要影响力的深度强
肖智清程序设计12.2万字

强化学习：原理与Python实战

最新章节

强化学习：原理与Python实现

科学仪器设备配置学：人工智能时代的界面管理

这就是DeepSeek：普通人如何抓住AI红利

机器学习（第2版）

巧用ChatGPT快速搞定数据分析

AI智能写作：巧用AI大模型让新媒体变现插上翅膀

人工智能基础与应用

人工智能数学基础与Python机器学习实战

AI赋能HR：AI 10倍提升HR工作效率的方法与实践

巧用ChatGPT快速提高职场晋升力