推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

平行学习—机器学习的一个新型理论框架

更新时间:2019-12-24 02:25:31 大小:449K 上传用户:zhiyao6查看TA发布的资源 标签:机器学习 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

本文提出了一种新的机器学习理论框架.该框架结合了现有多种机器学习理论框架的优点,并针对如何使用软件定义的人工系统从大数据提取有效数据,如何结合预测学习和集成学习,以及如何利用默顿定律进行指示学习等目前机器学习领域面临的重要问题进行了特别设计.


部分文件列表

文件名 大小
平行学习—机器学习的一个新型理论框架.pdf 449K

部分页面预览

(完整内容请下载后查看)
43 卷 第 1 期  
2017 1 月  
Vol. 43, No. 1  
January, 2017  
ACTA AUTOMATICA SINICA  
平行学机器学习的一个新型理论框架  
3
5
7
李 力 1  
林懿伦 2  
曹东璞 4  
郑南宁 6  
王飞跃 2  
本文提出了一种新的机器学习理论框架. 该框架结合了现有多种机器学习理论框架的优点, 并针对如何使用软件定  
义的人工系统从大数据提取有效数据, 如何结合预测学习和集成学习, 以及如何利用默顿定律进行指示学习等目前机器学习  
领域面临的重要问题进行了特别设计.  
关键词 机器学习, 人工智能, 平行学习, 平行智能, 平行系统及理论  
引用格式 李力, 林懿伦, 曹东璞, 郑南宁, 王飞跃. 平行学习 机器学习的一个新型理论框架. 自动化学报, 2017, 43(1):  
1-8  
DOI 10.16383/j.aas.2017.y000001  
Parallel Learning — A New Framework for Machine Learning  
3
5
7
LI Li1  
LIN Yi-Lun2  
CAO Dong-Pu4  
ZHENG Nan-Ning6  
WANG Fei-Yue2  
Abstract In this paper, we propose a new framework of machine learning theory, parallel learningwhich incorporates  
and inherits many elements from various existing machine learning theories. Special designs are also presented to deal  
with some important problems in the machine learning research field, e.g., useful data retrieval from big data using  
software defined artificial systems, combination of predictive learning and ensemble learning, application of Merton0s law  
to prescriptive learning.  
Key words Machine learning, artificial intelligence, parallel learning, parallel intelligence, parallel system and theory  
Citation Li Li, Lin Yi-Lun, Cao Dong-Pu, Zheng Nan-Ning, Wang Fei-Yue. Parallel learning — a new framework for  
machine learning. Acta Automatica Sinica, 2017, 43(1): 1-8  
1 引言  
学习在过去  
年中取得了长足的发展 正受到越来  
越多人的关注 并在生物境  
等诸多领域中获得了成功的应用 与此同时 机器学  
习也面临越来越多的问题 传统机器学习理论框架  
的不足被逐渐发现和确认 新的机器学习理论框架  
不断被提出[1]  
随着计算能力的提高和计算理论的创新 机器  
收稿日期 2016-11-25 录用日期 2017-01-01  
Manuscript received November 25, 2016; accepted January 1,  
2017  
国家自然科学基金 (91520301) 资助  
Supported by National Natural Science Foundation of China  
中科院自动化所王飞跃研究员于  
年提出  
(91520301)  
本文责任编委 刘德荣  
Recommended by Associate Editor LIU De-Rong  
1. 清华信息科学与技术国家实验室 (), 清华大学自动化系 北京  
了平行系统的思想 试图用一种适合复杂系统的计  
算理论与方法解决社会经济系统中的重要问题 其  
主要观点是利用大型计算模拟测并诱发引导复  
杂系统现象 通过整合人工社会 计算实验和平行系  
统等方法 形成新的计算研究体系[2-5]  
100084 中国 2. 中国科学院自动化研究所复杂系统管理与控制国家  
重点实验室 北京 100190 中国 3. 中国科学院大学 北京 100049 中  
4. 英国克兰菲尔德大学驾驶员认知与自动驾驶实验室 克兰菲尔  
MK43 0AL 英国 5. 青岛智能产业技术研究院 青岛 266000 中国  
6. 西安交通大学人工智能与机器人研究所 西安 710049 中国 7. 国防  
在过去的  
多年中 平行系统这一研究体系  
在实践中取得了大量的成果 并不断丰富和完善起  
[6-9] 近年来 我们尝试将平行系统的思想扩展并  
引入到机器学习领域建立一种新型理论框架以更好  
地解决数据取舍动选择等传统机器学习理论不  
能很好解决的问题  
科技大学军事计算实验与平行系统技术中心 长沙 410073 中国  
1. National Laboratory for Information Science and Technol-  
ogy (TNList), Department of Automation, Tsinghua University,  
Beijing 100084, China 2. the State Key Laboratory of Man-  
agement and Control for Complex Systems, Institute of Au-  
tomation, Chinese Academy of Sciences, Beijing 100190, China  
3. University of Chinese Academy of Sciences, Beijing 100049,  
China 4. Driver Cognition and Automated Driving Labora-  
tory, Cranfield University, Cranfield MK43 0AL, UK 5. Qing-  
dao Academy of Intelligent Industries, Qingdao 266000, China  
6. Institute of Artificial Intelligence and Robotics (IAIR), Xian  
Jiaotong University, Xian 710049, China 7. Research Center  
of Military Computational Experiments and Parallel Systems,  
National University of Defense Technology, Changsha 410073,  
China  
以下我们将首先回顾常见的一些机器学习理论  
并比较它们在数据获取  
行动选择这一核心问题  
上的处理方式 接着 我们将提出 平行学习 这一  
新型机器学习理论框架 并着重分析其独特之处 最  
后我们总结全文  
2
43 卷  
2 一些现有机器学习的理论框架  
系统不再被动地接受数据 而转为主动寻求 系统在  
( )  
时刻每获得一个数据  
在强化学习中 为系统  
( )  
为简化符号 下文中  
着眼于数据获取和行动选择之间的关系 我们  
可以建立如下数学模型来描述常见的一些机器学习  
理论框架  
状态 可采取一系列行动  
系统状态和行动记为  
时刻的行动  
强化学习允许我们在  
影响到我们在  
时刻的获取  
假设我们获取到一系列数据并构成集合  
的数据  
也即存在如下的 · ·  
×
+1  
{ }  
· · ·  
若研究对象为复杂系统 则这  
表示特定的状态转移函数  
些数据通常为观测到的系统状态或输出 针对这  
些数据 我们可以采取一系列行动  
并构成集合  
表示数据  
|
+1  
+1  
{
}
· · ·  
我们的目标函数为  
的一个子集 每一个行动可以导致一个回报  
且数据的获取和采取行动可以在时间上分  
+1  
=1  
离 我们的目标是 通过机器学习 最大化长期回报  
·
为 时刻系统处于状态 加  
+1  
其中  
行动  
状态  
1≤ ≤  
=1  
所获得的即时回报  
的长期平均回报  
为系统处于  
+1  
如果我们关心的是每一个行动导致的损失  
目标函数可变为最小化长期损失  
为折扣因子  
+1  
因此 强化学习属于主动学习  
[17]  
的一种 我们可以选取特定的行动来兼顾优  
化目标函数和探索输入数据集合  
机器学习是非常重要的改进  
这相对于在线  
1≤  
=1  
[10-11]  
对于常见的有监督学习  
然而 经典的强化学习将数据获取和对应行动  
局限在马尔科夫决策过程  
而言 上述这一模型可以进一步简化为 当所有数据  
已知且已经被正确分类后 我们采取一个行动 建立  
一个函数映射 通常是分类函数 来最小化分类误  
的框架中 限制了其能力的发挥 目前研  
究者提出了不少强化学习的变体 如深度强化学习  
但基本沿用了马尔  
一般而言 我们预设数据服从独立同分布假设  
科夫决策过程这一框架 这一做法虽然保证了一定  
范围内学习的有效性 却不能很好地应用到非马尔  
科夫决策过程  
则目标函数可进一步写为  
强化学习不需要传统意义上的有标签数据 实  
际上其学习的过程就是不断更新数据标签的过程  
但是它的学习效率并不高 需要跟环境进行大量交  
互从而获得反馈用以更新模型 当面临复杂系统大  
数据处理时 过高的系统状态维数常常使得可行解  
的探索变得十分困难[18-20]  
=1  
相对于有监督学习 在线机器学习  
[12-14]  
强调了数据是逐渐获取的 且每新  
获得一个数据 系统可基于所有已经获取的数据  
采取一个行动 对于在线机器学习的特例序贯学习  
我们每次仅仅获取一个数据  
3 平行学习的理论框架  
依据映射函数 · 产生一个预测行动  
着我们再获取 真正的标记数据 并计算由此  
最终我们的目标函数  
最小化长期后悔值  
为了进一步拓展学习能力 特别是为了解决强  
化学习所面临的难题 我们提出如下图 所示的平  
行学习的基本框架 其大致可以分为数据处理和行  
动学习两个互相耦合关联的阶段  
产生的损失  
为选取合适的映射  
·
在数据处理阶段 平行学习首先从原始数据中  
选取特定的 小数据 输入到软件定义的人工系统  
中 并由人工系统产生大量新的数据 然后这些人工  
数据和特定的原始小数据一起构成解决问题所需要  
学习的 大数据 集合 用于更新机器学习模型[18]  
在行动学习阶段 平行学习沿用强化学习的思  
路 使用状态迁移来刻画系统的动态变化 从人工合  
=1  
这里我们有多个行动 并随着所获数据的增多 不断  
优化采取的行动  
与在线学习类似 强化学习  
[15-16] 依然假设数据逐渐获取 但机器学习  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载