- 1
- 2
- 3
- 4
- 5
基于知识的深度强化学习研究综述
资料介绍
作为解决序贯决策的机器学习方法,强化学习采取持续的“交互-试错”机制,实现智能体(Agent)与环境的不断交互,从而学得完成任务的最优策略,契合了人类提升智能的行为决策方式。知识作为一种包含了经验、价值观、认知规律以及专家见解等要素的结构化信息,应用于强化学习可以有效提高Agent的学习效率,降低学习难度。鉴于此,本文以强化学习的基本理论为起点,对深度强化学习以及基于知识的深度强化学习研究成果进行了系统性的总结与梳理。
部分文件列表
文件名 | 大小 |
基于知识的深度强化学习研究综述.pdf | 2M |
部分页面预览
(完整内容请下载后查看)最新上传
-
sd-hyc 打赏1.00元 3天前
资料:神州易刻2024最新版
-
柏涵 打赏1.00元 3天前
-
21ic下载 打赏310.00元 3天前
用户:jh0355
-
21ic下载 打赏310.00元 3天前
用户:w178191520
-
21ic下载 打赏210.00元 3天前
用户:gsy幸运
-
21ic下载 打赏210.00元 3天前
用户:zhengdai
-
21ic下载 打赏210.00元 3天前
用户:jh03551
-
21ic下载 打赏110.00元 3天前
用户:liqiang9090
-
21ic下载 打赏60.00元 3天前
用户:sun2152
-
21ic下载 打赏60.00元 3天前
用户:xuzhen1
-
21ic下载 打赏80.00元 3天前
用户:xzxbybd
-
21ic下载 打赏25.00元 3天前
用户:WK520077778
-
21ic下载 打赏20.00元 3天前
用户:w1966891335
-
21ic下载 打赏20.00元 3天前
用户:铁蛋锅
-
21ic下载 打赏20.00元 3天前
用户:玉落彼岸
-
21ic下载 打赏15.00元 3天前
用户:kk1957135547
-
21ic下载 打赏10.00元 3天前
用户:zpf22332
-
21ic下载 打赏5.00元 3天前
用户:pangpidan
-
21ic下载 打赏5.00元 3天前
用户:hpxny
-
21ic下载 打赏5.00元 3天前
用户:pandq2009
-
21ic下载 打赏5.00元 3天前
用户:tomp
-
21ic下载 打赏310.00元 3天前
用户:小猫做电路
-
21ic子站宣传员 打赏15.00元 3天前
-
106982800 打赏1.00元 3天前
-
llyy232008 打赏3.00元 3天前
-
21ic小能手 打赏15.00元 3天前
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏5.00元 3天前
资料:温控制冷箱单片机程序
-
21ic小能手 打赏15.00元 3天前
-
21ic小能手 打赏20.00元 3天前
-
21ic小能手 打赏10.00元 3天前
资料:红外遥控接收实验
-
21ic小能手 打赏10.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏10.00元 3天前
资料:格力凉之静外机原理图
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏5.00元 3天前
-
21ic小能手 打赏15.00元 3天前
-
21ic小能手 打赏15.00元 3天前
-
21ic小能手 打赏5.00元 3天前
全部评论(0)