- 1
- 2
- 3
- 4
- 5
基于知识的深度强化学习研究综述
资料介绍
作为解决序贯决策的机器学习方法,强化学习采取持续的“交互-试错”机制,实现智能体(Agent)与环境的不断交互,从而学得完成任务的最优策略,契合了人类提升智能的行为决策方式。知识作为一种包含了经验、价值观、认知规律以及专家见解等要素的结构化信息,应用于强化学习可以有效提高Agent的学习效率,降低学习难度。鉴于此,本文以强化学习的基本理论为起点,对深度强化学习以及基于知识的深度强化学习研究成果进行了系统性的总结与梳理。
部分文件列表
| 文件名 | 大小 |
| 基于知识的深度强化学习研究综述.pdf | 2M |
部分页面预览
(完整内容请下载后查看)最新上传
-
zhengdai 打赏1000.00元 1天前
资料:STM32IAP使用说明
-
gsy幸运 打赏955.00元 1天前
资料:STM32IAP使用说明
-
小猫做电路 打赏855.00元 1天前
资料:STM32IAP使用说明
-
21ic小能手 打赏310.00元 3天前
用户:zhengdai
-
21ic小能手 打赏320.00元 3天前
用户:liqiang9090
-
21ic小能手 打赏310.00元 3天前
用户:gsy幸运
-
21ic小能手 打赏270.00元 3天前
用户:jh03551
-
21ic小能手 打赏240.00元 3天前
用户:小猫做电路
-
21ic小能手 打赏210.00元 3天前
用户:w178191520
-
21ic小能手 打赏90.00元 3天前
用户:kkfjenui
-
21ic小能手 打赏60.00元 3天前
用户:liao6
-
21ic小能手 打赏60.00元 3天前
用户:w1966891335
-
21ic小能手 打赏90.00元 3天前
用户:jh0355
-
21ic小能手 打赏30.00元 3天前
用户:xuzhen1
-
21ic小能手 打赏30.00元 3天前
用户:sun2152
-
21ic小能手 打赏50.00元 3天前
用户:xzxbybd
-
21ic小能手 打赏50.00元 3天前
用户:mulanhk
-
21ic小能手 打赏20.00元 3天前
用户:x15580286248
-
21ic小能手 打赏15.00元 3天前
用户:w993263495
-
21ic小能手 打赏30.00元 3天前
用户:玉落彼岸
-
21ic小能手 打赏20.00元 3天前
用户:铁蛋锅
-
21ic小能手 打赏10.00元 3天前
用户:zmcch
-
21ic小能手 打赏10.00元 3天前
-
21ic下载 打赏1.00元 3天前
用户:zzcyolo
-
21ic下载 打赏1.00元 3天前
用户:玉落彼岸
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
sdqdjqk 打赏1.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
wisdomlin 打赏1.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
799902619 打赏1.00元 3天前
资料:新立新龙软件
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏10.00元 3天前




全部评论(0)