选元素进行划分,重复此步骤直到最后得到的子集只包
含某一类型的数据为止。
这种结构模式设计可以对现场作业风险进行提前预警,
根据预警等级来判断哪一个作业现场存在风险可能性较
大,哪个时间段违章风险可能性较大,将电力现场作业
安全系统的数据库分为模式、模式以及外模式等三级轴
象模式口],电力现场作业安全系统的数据库三级模式如
图4所示。
SLIQ算法原理:设集合N包含n个国家电网公司数
据样本,类标号属性可以用m个不同值来表示,对应的
m个类别Mi,ie(1,2,3, ,m),设Mi中包含Ni个样
本,则对于一个给定的样本分类所需要的期望信息为:
i(a。,口:,口,, ,%)=一 只log:(只)
设Q中有x个不同的数据值{n,,n2,n3, ,n。),
将集合A通过Q来进行划分,可以将集合A划分为X个子
集{A。,A:,A,, ,A。},其中集合A中Q的取值为Q,
的数据信息样本都会在A。中包含,如果Q是所选择的测
试属性,设A。。是子集A。中M;的样本数,那么Q划分的子
集计算结果为:
L——^j
图4电力现场作业安全管理系统的数据库三级模式图
E(Q):窆笠鱼≠丛砒,,向, ,如)
y=l
为了降低国家电网公司工作人员的现场施工作业风
险,系统的数据库采用03版本进行安全管理系统的数据
库开发,主要是根据系统在运行过程中电力现场作业数
据信息的管理以及前台数据的存储处理等工作。在基于
风险预警的数据库改进基础上,得知系统的数据库需要
建立表格,主要包括国家电网公司设备的基本信息表、
电网设备型号表、状态信息表以及用户基本数据信息表
计算公式中的尘垒』!丛表示所有子集中
A
的Q取Qv值的所有样本个数之和与集合A中所有样本之比。
根据期望信息计算和E(A)值的计算,可以很容
易得到国家电网公司数据信息的增益值,然后利用Q划
分管理系统中每一个分支结点,国家电网公司数据信息
增益计算公式为:
等,每一个表格之间都不是孤立存在的,是通过相关键
关联在一起的,共同构成了一个现场作业安全管理系统
数据库主体。
Gain(Q)=I(4,以,
,4)一E(o)
根据数据信息增益值可以看出,计算得到的E
(Q)值越小,Gain(Q)的计算结果就越大,也就对
每一个表都是建立在物联网技术上进行数据库改进
电力现场作业安全管理越有利。
的,从而对现场作业风险提前预警。系统中用户基本数
据信息表主要是用来储存用户的详细信息和访问权限;
电力设备的基本信息统计表是用来存放一些设备的基本
信息;电网设备型号表的内容主要有电网设备的型号编
码以及设备类型名称等相关信息。
SLIQ算法的详细步骤为:
1)从国家电网公司数据集合中随机抽取一个子
集,使子集中同时含有A和B;
2)采用SPRINT算法生成一棵该子集的决策树;
3)判断抽取子集意外的子集是否有使用步骤2)生
成的决策树,并根据电网信息,找出判定错误的子集;
4)如果有判定错误的子集,则将判定错误的子集
重复步骤1)和步骤2)操作,重新生成决策树;如果没
有判定错误的子集,说明生成的电网数据信息是可信任
的,整个算法流程结束。
2.2基于现场风险判定的系统算法优化
为了判定哪个现场存在风险可能性较大以及哪个时
间段违章风险可能性较大,本文基于工器具和人员安全
的服务器设计的基础上,提出SLIQ算法的优化设计来
实现基于物联网技术的电力现场作业安全管理系统的软
件设计。SLIQ算法是目前应用最广泛的决策树算法,
是在SPRINT算法的基础上设计的陋】,SPRINT算法的工
作流程为:首先在作业现场所有元素中筛选出作业风险
可能性最大的因素,再根据筛选的数据将国家电网公司
数据划分为若干个子集,对划分每一个子集进行逐一判
断,最后选择出一个影响力最大的因素;接着继续对所
图5为SLIQ算法的流程图,其中训练集是由X和Y
组成的,X,、x:分别是x的子集,Y。和Y:分别是Y的
子集。
3实例分析
为了证明本文改进的系统设计可以降低现场作业的
[112|
第41卷第8期2019-08
万方数据
全部评论(0)