会员
深度强化学习理论与实践
龙强 章胜编著计算机网络/计算机理论、基础知识· 12.5万字
更新时间:2024-12-27 22:26:05
最新章节:参考文献开会员,本书免费读 >
本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍了强化学习的模型,第5章简单介绍了深度学习和PyTorch编程框架。本书可以作为理工科大学相关专业研究生的学位课教材,也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材,还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。
品牌:清华大学
上架时间:2023-03-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
深度强化学习理论与实践最新章节
查看全部- 参考文献
- 9.5 AlphaGo系列算法的应用与启示
- 9.4.3 MuZero的算法流程
- 9.4.2 MuZero中的MCTS
- 9.4.1 MuZero中的深度神经网络
- 9.4 MuZero算法介绍
- 9.3.3 AlphaZero的算法流程
- 9.3.2 AlphaZero相对于AlphaGo Zero的改进与调整
- 9.3.1 从围棋到其他棋类需要解决的问题
- 9.3 AlphaZero算法介绍
龙强 章胜编著
主页
同类热门书
最新上架
- 会员
微课设计与制作标准教程(全彩微课版)
《微课设计与制作标准教程(全彩微课版)》内容围绕微课制作展开,以实用高效为写作目的,用通俗易懂的语言对微课设计与制作的相关知识进行详细介绍。计算机6.6万字 - 会员
大学计算机基础标准教程Windows 10+Office 2016(实战微课版)
本书以实用、够用为创作原则,以普及计算机使用方法为指导思想,在主流Windows10操作系统的基础上,用通俗易懂的语言对计算机的基础知识及基本应用进行详细阐述。全书共9章,包括计算机的发展历史、系统组成、硬件设备、Windows10的基本操作、个性化设置、文件与文件夹的管理、系统自带工具的使用、三大办公组件的使用、多媒体技术的应用、计算机网络与信息安全、网络新技术等。除了详细的说明与操作外,还计算机9.9万字 - 会员
人工智能数学基础
本书面向广大数据科学与人工智能专业的学生及初学者,力求通俗易懂、简洁清晰地呈现学习大数据与人工智能需要的基础数学知识,助力读者为进一步学习人工智能打好数学基础。全书分为4篇,共19章:微积分篇(第1~5章),主要介绍极限、导数、极值、多元函数导数与极值、梯度下降法等;线性代数篇(第6~10章),主要介绍向量、矩阵、行列式、线性方程组、特征值和特征向量等,并介绍这些数学知识在人工智能中的应用;概率统计算机8.5万字 - 会员
多源信息融合推理与应用
本书共共15章,主要包括多源信息融合处理理论与方法及多源信息目标检测、识别和应用两部分内容。书中具体讲述了多源信息融合处理的基本概念以及多源信息融合发展的核心理论方法,如Dempster-Shafer证据理论等;介绍了多源高冲突信息鲁棒性证据推理方法、多辨识框架下异构证据融合方法以及多值迁移融合方法等多种融合技术;给出了多源信息融合的典型应用,特别是在不确定数据分类、多源信息融合检测与识别领域的实计算机17万字 - 会员
深度强化学习理论与实践
本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍计算机12.5万字 - 会员
Access数据库基础与应用标准教程(实战微课版)
本书以理论为基础,以应用为导向,用大量的实例对Access数据库的应用进行全面讲解。全书共8章,主要内容包括数据库的基础知识、Access的基本操作、表的构建、查询的创建、窗体的设计、报表的设计、宏的自动化操作,以及数据库文件的管理。知识点覆盖《全国计算机等级考试二级Access数据库程序设计》考试大纲规定的内容。在介绍Access操作方法的同时,安排大量的动手练案例,并且穿插知识延伸小体例,理论计算机8.5万字 - 会员
深度序列模型与自然语言处理:基于TensorFlow 2实践
《深度序列模型与自然语言处理:基于TensorFlow2实践》以自然语言和语音信号处理两大应用领域为载体,详细介绍深度学习中的各种常用序列模型。在讲述理论知识的同时辅以代码实现和讲解,帮助读者深入掌握相关知识技能。《深度序列模型与自然语言处理:基于TensorFlow2实践》共12章,不仅涵盖了词向量、循环神经网络、卷积神经网络、Transformer等基础知识,还囊括了注意力机制、序列到序列问题计算机21.9万字 - 会员
深度探索Vue.js:原理剖析与实战应用
本书系统的介绍了Vue框架基础、框架应用、生态组成、项目实战、框架演进、Vue原理剖析及Vue框架的原理实现。全书共分为8章:第1章为行业发展介绍,第2章为Vue2.x的开发基础,第3章为Vue2.x的组件开发,第4章为VueCLI开发完全指南,第5章为VueCLI项目实战,第6章为Vite+Vue3完全开发指南,第7章为Vue3.x项目实战,第8章为实现原理介绍。书中主要内容包括:W计算机13.9万字 - 会员
文心一言从新手到高手(写作+绘画+教育+编程+助手)
文心一言是百度推出的一款基于大语言模型的生成式AI产品,《文心一言从新手到高手(写作+绘画+教育+编程+助手)》详细介绍了其在不同领域的应用方法,是一本全面、详尽的文心一言使用指南。《文心一言从新手到高手(写作+绘画+教育+编程+助手)》共8章,依次讲解了文心一言的基础知识、创意写作、零基础绘画、数据分析、营销文案写作、职场百宝箱、求职招聘、教育教学、学生学习、编程辅助、生活顾问、插件、文心一言A计算机12.2万字