:
DOI10.7544issn10001239 .2017 .20151052
-
计 算 机 研 究 与 发 展
?
(): ,
543 633641 2017
-
JournalofCom uterResearchandDevelo ment
ꢀ ꢀ ꢀ ꢀ ꢀ
p p
ꢀ
基于组合机器学习算法的软件缺陷预测模型
傅艺绮
董
威
尹良泽 杜雨晴
ꢀ ꢀ
ꢀ
ꢀ
(
)
国防科学技术大学计算机学院 长沙
ꢀ
410073
ꢀ
( _
fu303503 163.com
@
)
SoftwareDefectPredictionModelBasedontheCombinationofMachineLearnin
ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ
ꢀ
ꢀ
g
Alorithms
g
,
,
,
FuYii Don Wei YinLianze andDuYuin
g
ꢀ ꢀ q g
ꢀ q
g
ꢀ
ꢀ
(
,
,
Chansha410073
gy
)
Colleeo Com uter NationalUniversit o DeenseTechnolo
ꢀ
ꢀ
ꢀ
g
f
p
y f
ꢀ ꢀ
f
g
ꢀ
,
Abstract Accordin tothemetricsinformationanddefectsfoundinasoftware roduct wecanuse
g ꢀ
ꢀ ꢀꢀ ꢀp ꢀ ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
,
softwaredefect redictiontechnolo to redictmoredefectsthatma alsoexistasearl as ossible
gy ꢀp
ꢀp ꢀ ꢀ ꢀ ꢀ ꢀ y ꢀ ꢀ ꢀ ꢀp
ꢀ
y
ꢀ
ꢀ
ꢀ
thentestin andvalidationresourcesareallocatedbasedonthe redictionresulta roriatel .Defect
ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀp ꢀ ꢀpp p
g
ꢀ
y
rediction based on machinelearnin techniuescanfind software defectscom rehensivel and
ꢀ ꢀ ꢀ ꢀ ꢀ
p
ꢀ
ꢀ
ꢀ
g
ꢀ
q
ꢀ
p
y
ꢀ
,
automaticall anditisbecomin oneofthemainmethodsofcurrentdefect redictiontechnoloies.In
ꢀꢀ ꢀ ꢀꢀ ꢀ ꢀ ꢀp
y
g
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
g
,
ordertoim rovetheefficienc andaccurac of rediction selectionandresearchofmachinelearnin
ꢀ ꢀ p ꢀ ꢀ
y ꢀp g
ꢀ
ꢀ
y
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
,
alorithmsisthecritical art.Inthis aer wedocom arativeanalsistodifferentmachinelearnin
ꢀ ꢀ ꢀ ꢀp ꢀpp ꢀ ꢀ
y ꢀ ꢀ g
g
ꢀ
p
ꢀ
ꢀ
ꢀ
,
defect redictionmethods andfindthatdifferentalorithmshavebothadvantaesanddisadvantaes
ꢀp ꢀ g
g ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
g
,
indifferentevaluationindexes.Takin theseadvantaes werefertothestackin interationlearnin
ꢀ ꢀ ꢀ
g
ꢀ
ꢀ
ꢀ
g
ꢀ
ꢀ
g
ꢀ
g
ꢀ
g
ꢀ
,
methodand resentacombinedsoftwaredefect redictionmodel.Inthismodel wefirst redictonce
ꢀp ꢀꢀ ꢀp ꢀp
,
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
,
thenaddthe redictionresultsofdifferentmethodsintheoriinaldatasetasnewsoftwaremetrics
ꢀp ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ ꢀ g ꢀ ꢀ ꢀ ꢀ ꢀ
ꢀ
ꢀ
,
andthen redictaain.Finall wemakeexerimentsonEclisedataset.Exerimentalresultsshow
ꢀp ꢀg ꢀ p ꢀ ꢀ p ꢀ
ꢀ
y
ꢀ
p
ꢀ
ꢀ
,
thatthismodelistechnicalfeasibilit andcandecreasethecostoftimeandim rovetheaccurac .
ꢀ ꢀ
ꢀ
ꢀ
ꢀ ꢀ
ꢀ
y
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ
ꢀ p
ꢀ
ꢀ
y
; ; ; ;
Ke words softwaredefect rediction machinelearnin ensemblelearnin combination Eclise
ꢀ
ꢀ
ꢀ
ꢀp
g
ꢀ
g
p
y
ꢀ
redictiondataset
p
ꢀ
软件缺陷预测是根据软件产品中提取的度量信息和已经发现的缺陷来尽早地预测软件可能还
摘
要
ꢀ
ꢀ
,
存在的缺陷 基于预测结果可合理分配测试和验证资源 基于机器学习的缺陷预测技术能够较全面地
.
、
,
自动地学习模型来发现软件中的缺陷 已经成为缺陷预测的主要方法 为了提高预测的效率和准确性
.
,
,
对机器学习算法的选择和研究是很关键的 对不同的机器学习缺陷预测方法进行对比分析 发现各算法
.
,
在不同评价指标上有不同的优势 利用这些优势并结合机器学习中的
集成学习方法提出了将
stackin
g
不同预测算法的预测结果作为软件度量并进行再次预测的基于组合机器学习算法的软件缺陷预测模
,
型 最后用该模型对
,
数据集进行实验 表明了该模型的有效性
.
Eclise
p
;
;
;
;
软件缺陷预测 机器学习 集成学习 组合
Eclise
预测数据集
关键词
ꢀ
p
中图法分类号
TP311
ꢀ
:
;
修回日期
2015 12 09
:
收稿日期
-
-
- -
2016 06 30
ꢀ
ꢀ
: “ ”
基金项目 国家 九七三 重点基础研究发展计划基金项目
(
);
(
,
91318301 61690203
)
国家自然科学基金项目
2014CB340703
( )( )
Thisworkwassu ortedb theNationalBasicResearchProramofChina 973Proram 2014CB340703 andtheNational
ꢀ ꢀ
ꢀ
ꢀ
ꢀ pp
ꢀy
ꢀ
ꢀ
ꢀ
ꢀ
g
g
ꢀ
ꢀ
ꢀ
(
,
)
NaturalScienceFoundationofChina91318301 61690203 .
ꢀ ꢀ
ꢀ
ꢀ
:
通信作者 董威
( )
wdon nudt.edu.cn
g@
ꢀ
全部评论(0)