注重体验与质量的电子书资源下载网站
分类于: 云计算&大数据 其它
简介
深度强化学习: 原理与实践 豆 0.0分
资源最后更新于 2020-07-26 15:38:23
作者:陈仲铭
出版社:
出版日期:2019-01
ISBN:9787115505323
文件格式: pdf
标签: 强化学习 人工智能 机器学习 推荐好书 算法 我想读这本书
简介· · · · · ·
本书构建了一个完整的深度强化学习理论和实践体系:从马尔科夫决策过程开始,根据价值函数、策略函数求解贝尔曼方程,到利用深度学习模拟价值网络和策略网络。书中详细介绍了深度强化学习相关最新算法,如Rainbow、APE-X算法等,并阐述了相关算法的具体实现方式和代表性应用(如AlphaGo)。此外,本书还深度剖析了强化学习各算法之间的联系,有助于读者举一反三。
本书分为4个部分:初探强化学习、求解强化学习、求解强化学习进阶和深度强化学习。涉及基础理论到深度强化学习算法框架的各方面内容,反映了深度强化学习领域过去的发展历程和最新的研究进展,有助于读者发现该领域中新的研究问题和方向。
本书适用于计算机视觉、计算机自然语言的相关从业人员,以及对人工智能、机器学习和深度学习感兴趣的人员,还可作为高等院校计算机等相关专业本科生及研究生的参考用书。
目录
第一篇 初探强化学习
--第1章 强化学习绪论
--第2章 数学基础及环境
第二篇 求解强化学习
--第3章 动态规划法
--第4章 蒙特卡洛法
--第5章 时间差分法
第三篇 求解强化学习进阶
--第6章 值函数近似法
--第7章 策略梯度法
--第8章 整合学习与规划
第四章 深度强化学习
--第9章 深度强化学习
--第10章 深度Q网络
--第11章 深度强化学习算法框架
--第12章 从围棋AlphaGo到AlphaGo Zero
--第1章 强化学习绪论
--第2章 数学基础及环境
第二篇 求解强化学习
--第3章 动态规划法
--第4章 蒙特卡洛法
--第5章 时间差分法
第三篇 求解强化学习进阶
--第6章 值函数近似法
--第7章 策略梯度法
--第8章 整合学习与规划
第四章 深度强化学习
--第9章 深度强化学习
--第10章 深度Q网络
--第11章 深度强化学习算法框架
--第12章 从围棋AlphaGo到AlphaGo Zero