推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

迁移蜂群优化算法及其在无功优化中的应用

更新时间:2019-12-25 15:01:08 大小:703K 上传用户:zhiyao6查看TA发布的资源 标签:迁移蜂群优化算法 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

提出了一种全新的迁移蜂群优化算法,并应用到电力系统无功优化问题.利用Q学习的试错与奖励机制构造蜂群的学习模式,并采用强化学习的行为迁移技术实现蜂群的迁移学习.为解决算法求解多变量优化问题遇到的维数灾难,提出了状态–组合动作链的方式将状态–动作空间分解成若干低维空间,明显降低算法的计算难度.仿真结果表明:本文所提算法可以保证最优解质量的同时,寻优速度能提高到传统启发式智能算法的4~67倍左右,非常适用于大规模复杂系统非线性规划问题的快速求解.


部分文件列表

文件名 大小
迁移蜂群优化算法及其在无功优化中的应用.pdf 703K

部分页面预览

(完整内容请下载后查看)
43 卷 第 1 期  
2017 1 月  
Vol. 43, No. 1  
January, 2017  
ACTA AUTOMATICA SINICA  
迁移蜂群优化算法及其在无功优化中的应用  
余 涛 1  
徐茂鑫 1  
张孝顺 1  
提出了一种全新的迁移蜂群优化算法, 并应用到电力系统无功优化问题. 利用 Q 学习的试错与奖励机制构造蜂群的  
学习模式, 并采用强化学习的行为迁移技术实现蜂群的迁移学习. 为解决算法求解多变量优化问题遇到的维数灾难, 提出了状  
组合动作链的方式将状态 动作空间分解成若干低维空间, 明显降低算法的计算难度. 仿真结果表明: 本文所提算法可以  
保证最优解质量的同时, 寻优速度能提高到传统启发式智能算法的 4 67 倍左右, 非常适用于大规模复杂系统非线性规划问  
题的快速求解.  
关键词 迁移蜂群优化, 强化学习, 行为迁移, 无功优化  
引用格式 徐茂鑫, 张孝顺, 余涛. 迁移蜂群优化算法及其在无功优化中的应用. 自动化学报, 2017, 43(1): 83-93  
DOI 10.16383/j.aas.2017.c150791  
Transfer Bees Optimizer and Its Application on Reactive Power Optimization  
XU Mao-Xin1  
ZHANG Xiao-Shun1  
YU Tao1  
Abstract This paper proposes a novel transfer bees optimizer (TBO), which is implemented to solve the reactive power  
optimization of power systems. The trial-and-error and the reward mechanism of Q-learning is adopted to construct the  
learning mode of the bees, and the technology of behavior transfer from reinforcement learning is used for transfer learning.  
Moreover, a space-action chain is proposed to decompose the solution space into several lower-dimensional spaces, thus  
it can solve the curse of dimension resulted from the multiple variables optimization problem. Simulation results show  
that TBO can obtain a high-quality optimal solution, while its convergence speed can be accelerated as many as 4 to  
67 times faster than that of the conventional heuristic artificial algorithm (AI) algorithm, which is very suitable for fast  
optimization of nonlinear programming in a large-scale complex system.  
Key words Transfer bees optimizer (TBO), reinforcement learning, behavior transfer, reactive power optimization  
Citation Xu Mao-Xin, Zhang Xiao-Shun, Yu Tao. Transfer bees optimizer and its application on reactive power  
optimization. Acta Automatica Sinica, 2017, 43(1): 83-93  
电力系统运行中经常会遇到机组组合济调  
功优化等非线性规划问题[1-2] 目前 解决  
此类问题的方法主要有牛顿法[3]点法[4] 等传  
统优化方法以及基于概率搜索的启发式群智能算  
[5-13] 启发式算法因其对具体数学模型的依赖程  
度较低 易于处理非线性和离散性优化问题等特点  
而逐渐成为研究的热点  
特点而逐渐在控制值计算等多个领域得  
到广泛应用 在电力系统领域中 人工蜂群算法也被  
成功应用于解决配网规划荷分配布式电源  
优化布局等问题[5-6]  
类似于遗传  
[7]群  
优化  
[8]子群优  
[9]  
等传统  
人 工 蜂 群 算 法  
[10-11]  
群体智能算法 人工蜂群算法的寻优性能主要依靠  
群体智慧的特性 蜂群个体缺乏自主学习的能力 其  
搜索行为是完全随机的 这种随机的特性会使得算  
法带有一定的盲目性 从而影响算法在复杂多目标  
环境中的优化效率 此外 人工蜂群算法中各个优化  
任务是孤立的 在学习新任务的时候没有利用过去  
的学习经验和结果 从而使得每次执行新的优化任  
务都需要耗费较长的寻优时间 难以满足大规模复  
杂系统的快速寻优的要求  
年提出的一种  
启发式群智能算法 算法启发于蜜蜂觅食行为 并因  
其具有结构简单于实现以及局部搜索能力强等  
收稿日期 2015-11-24 录用日期 2016-05-23  
Manuscript received November 24, 2015; accepted May 23, 2016  
国家重点基础研究发展计划 (973 计划) (2013CB228205), 国家自然  
科学基金 (51177051, 51477055) 资助  
Supported by National Key Basic Research Program of China  
(973 Program) (2013CB228205) and National Natural Science  
Foundation of China (51177051, 51477055)  
本文责任编委 王占山  
Recommended by Associate Editor WANG Zhan-Shan  
1. 华南理工大学电力学院 广州 510640  
1. School of Electric Power, South China University of Tech-  
迁移学习[14-17] 是近年引起广泛关注和研究的  
一种学习构架 旨在根据任务之间的相似性 利用过  
去学习经验和结果 有效提高新任务的学习效率 基  
nology, Guangzhou 510640  
84  
43 卷  
于此 本文提出一种迁移蜂群优化  
增强了对较优蜜源的搜索能力 从而加速算法收敛  
侦查蜂的引入则增加搜索全局最优蜜源的概率 此  
外当蜜源枯竭后 采蜜蜂则会在全域内重新随机选  
择新的蜜源 从而提高算法跳出局部收敛的能力  
算法 以期望解决大规模复杂系  
统的快速寻优问题 相比传统人工智能算法 本文所  
提的  
算法有以下创新和优势  
利用  
学习的相关技术[18-19] 构造一种全  
蜂群学习模式  
知识获取  
新的具有学习能力的蜜蜂群体 并实现蜂群的知识  
学习存和迁移  
传统  
算法通过蜂群的协同对蜜源空间进  
首次应用状态 动作组链对高维的状态 动  
作空间进行分解 有效解决了传统 学习的 维数  
灾难 问题  
行概率搜索 以期直接获得问题的最优解 而强化学  
习则是一类根据环境反馈来学习的技术 学习的优  
化目标是动态的策略 因此 基于经典  
学习的试  
蜂群中多个不同角色蜜蜂的同时试错探索  
可以明显加速状态 动作空间 的更新效率  
错与奖励机制的蜂群学习模式与传统人工蜂群的简  
单个体交互模式有较大的不同  
根据不同优化任务之间的相似性  
如图 所示  
中保留了侦查蜂和采蜜蜂的  
以高效利用已学习的知识来加速新优化任务的学习  
极大提高了算法的收敛速度  
分工 蜂群首先从状态 动作空间 中获取知识并  
制定行动策略对蜜源环境进行试错学习 然后将蜜  
源环境提供的奖励反馈到空间 调整策略 直到获  
得最优策略使得蜂群获得的回报最大  
为了验证算法的性能 本文利用电力系统的  
典型非线性规划问题之一 无功优化 分别引入  
[12]  
搜索  
[13]子遗传算  
[20]  
和合作  
型协同进化遗传算法  
[21]  
种智能算法进  
行了  
节点和  
节点系统仿真比  
较分析  
1 TBO 算法  
人工蜂群寻优模式  
2 TBO 学习模式  
Fig. 2 Learning mode of TBO  
人工蜂群的寻优模式如图 所示 算法中采蜜  
蜂在其蜜源附近随机地搜索新的蜜源直到蜜源枯竭  
同时通过摇摆舞向观察蜂传递蜜源信息 观察蜂根  
据采蜜蜂分享的蜜源信息概率地选择一个较好的蜜  
源进行搜索 侦查蜂在全域内随机地搜索新的蜜源  
状态 动作空间分解  
目前 状态 动作空间  
[18] 表格的大小等于  
的个数 因此 当求解问题的规模变大时 空间  
主要用  
表实  
×
的笛卡尔乘积中元素  
元素个数将呈指数增加 从而导致迭代计算变得难  
以实现 针对此类 维数灾难 问题 最常用的方法  
是分层强化学习方法[22-23] 然而优化任务的分解分  
层设计及联系往往难以确定 导致算法容易收敛于  
局部最优解  
为此本文依据蜜源路径优化的过程 将高维的  
状态 动作空间 分解成多个相互联系的低维度状  
态 动作组合链 如图 所示 在  
维的解空间  
· · ·  
内 每个变量  
分别指定  
空间相  
1
2
3
一个  
与之对应 变量之间依靠各自的  
1 人工蜂群寻优模式  
互联系 蜂群动作的选择是一种基于  
过程 当确定变量  
+1  
的链式选择  
Fig. 1 Searching mode of ABC  
的动作后 以此动作作为下一  
算法中采蜜蜂承担了主要的搜索任务 从而使  
得算法具有较强的局部搜索能力 观察蜂的协助则  
个变量的当前状态 根据  
选择下一个变量的动  

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载