据式(8)的前d个物联网虚假数据最大特征值相应的特征向
量构成。
据信息的剩余数据信息量作为虚假数据信息量进行虚假数
据特征自适应检测。
假设,{P
上述过程说明,监督保局投影的目标是保持物联网虚假
数据的局部关系,至此,在m维物联网虚假数据相空间中相
点筇(i)={石(i),z(i+t), ,舅(i+(m—1)£)}存在一个最近
邻点∞““(i),利用式(9)计算出两点之间的距离
P,,P:, ,P。}代表已知的经过训练和分类的
物联网虚假数据信息量模板向量,对于数据特征并,可通过计
算其信息量获取虚假数据信息的概率,则对于任意的物联网
数据信息量菇i,其与虚假数据信息的近似度利用式(15)进行
计算
(9)
R。(i)=怯(i)一戈ⅣⅣ(i)|I
当物联网虚假数据相空间维数从m转换为m+1时,则
数据相点之间的距离R。+,(i)与尺。(i)之间存在以下关系
懈*p(c:l石)忙峨||
s溉(石f,只)=—三兰兰======—_===
尺:+。(i)=R:(i)+ll石(i+m£)一石删(i+mt)112(10)
分析式(10)可知,如果物联网网络系统混沌运动轨迹无
扭曲变化,R。+,(i)与尺。(i)之间相差不大,则可将其视为因
嵌入维数m过低导致的物联网虚假数据近邻点,通常满足
√善忪?8p(cz I茹)If。√荟。己||
式中,样代表物联网虚假数据伪装损失函数,p(c。l Ki)代表
物联网真实数据信息量,p(c:I,ci)代表物联网虚假数据信息
量。假设,西代表物联网虚假数据信息判定的阈值,则有:
(Rm+,(i)一Rm(i))/尺m(i)>R,
(11)
满足式(11)时,认定戈 (i)为戈(i)的虚假近邻点,R,代
表阈值,对于噪声的物联网虚假数据,可视为当满足R。+,
‘
I
1U
(16)
J
』8im(菇;,弓) 咖,虚假数据
Lsim(咒;,尸f)<咖,其他数据
(i)/凡(i) 2时,搿 (i)为尤(i)的虚假数据特征近邻点,
其中
且对于物联网虚假数据信息而言,其中虚假数据信息的占有
比为
(12)
心=专 [石(i)一弘互=专 并(i)
3.2物联网虚假数据特征自适应检测
占=c。rd((菇)i)tp(cz
(17)
l并)/ max((z)i)
在进行物联网虚假数据特征自适应检测时,计算物联网
数据信息量的真伪信息函数,根据虚假数据特征中虚假信息
量发生的概率,计算虚假数据特征中虚假信息的占有比重,
并根据物联网虚假数据特征模板向量进行虚假数据信息近
似度计算,通过阈值比较进行虚假数据特征自适应检测。
在进行物联网虚假数据特征自适应检测过程中,以3.1
节获取的物联网虚假数据特征提取结果为依据,结合支持向
量机理论对物联网数据特征信息量进行聚类和真伪信息筛
选,以物联网数据真实程度阈值和虚假数据特征信息量中虚
假信息的存在概率及近似度阈值作为判决规则进行物联网
虚假数据特征信息识别,并以近邻区和增量学习为尺度对整
个物联网虚假数据特征样本空间进行降维和尺度自适应检
测。具体过程如下所述:
4仿真证明
为了证明本文提出的基于监督保局投影的物联网虚假
数据特征自适应检测方法的有效性,需要进行一次仿真。在
假设,物联网数据序列由某一数据集D的信息量构成,
将其训练分解为物联网数据特征向量{戈l戈。,z:, ,戈。}和决
madab
7.O环境下搭建物联网虚假数据特征自适应检测仿真
平台。实验数据来源于物联网网络数据集包含的500万条
数据记录。
策向量{c
c。,c:, ,c。},并设定物联网数据特征向量的各个
分量之间相对独立,则根据信息量可分为真实物联网信息和
物联网虚假信息两类(c,,c:),在进行物联网新数据集检测
时,利用式(13)计算该数据集x属于物联网真实数据信息和
虚假信息的概率
分别采用监督保局投影方法和朴素贝叶斯方法进行物
联网虚假数据特征自适应检测实验。将2种方法进行物联
网虚假数据特征分类精确度(%)对比,对比结果用图1进行
描述。
分析图1可知,利用监督保局投影方法进行物联网虚假
数据特征分类的精确度要高于朴素贝叶斯方法,这主要是因
为监督保局投影方法先运用虚假近邻点理论对映射转换后
数据矩阵进行特征约筒,获得物联网数据原始特征空间的特
征子集,在此基础上以物联网数据真实程度阈值和虚假数据
特征信息量中虚假信息的存在概率及近似度阈值作为判决
规则进行物联网虚假数据特征信息识别,并以近邻区和增量
学习为尺度对整个物联网虚假数据特征样本空间进行降维
和尺度自适应检测,使得监督保局投影方法进行物联网虚假
数据特征分类精度较高。
毗 =警=冉掣 ,
以式(13)计算的概率为依据,对于物联网新数据信息量而
言,利用式(14)定义物联网虚假数据的存在概率A(七)
rA(七)=cord((f):。)+p(c。1 f) 日,真实数据特征
【A(^)=cord((£):)。p(c:l£) 盯,虚假数据特征
(14)
式中,介于阈值之间的物联网数据安全度为未知,当满足p=
∥时,物联网数据信息量被准确划分为真伪数据信息簇,在
进行物联网虚假数据特征自适应检测过程中,将除去真实数
一278一
万方数据
全部评论(0)