推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

基于存储库数据挖掘的开源软件成功度量方法

更新时间:2019-12-24 02:49:38 大小:1M 上传用户:守着阳光1985查看TA发布的资源 标签:数据挖掘 下载积分:1分 评价赚积分 (如何评价?) 收藏 评论(0) 举报

资料介绍

开源软件已广泛应用于各软件领域,例如操作系统、容器等,但目前尚没有一种能够综合度量开源软件的方法.我们在用户兴趣度量和开发参与度量的基础上,提出了一种能够克服度量维度单一的局限性的度量方法.基于DM模型、软件生存力模型等相关文献研究和开源软件存储库数据挖掘,通过对项目过程数据进行聚类、主成分分析、回归分析和对开发过程的思考,本文提出一种基于存储库数据和统计学算法的开源软件成功度度量模型.并通过与用户兴趣度量结果和开发参与度量结果对比分析,证明本文的度量模型能够基于可自动无扰采集的存储库数据,更全面的衡量开源软件项目的成功.度量模型可应用于企业选择优质开源项目、学术研究、智能项目推荐等领域.


部分文件列表

文件名 大小
基于存储库数据挖掘的开源软件成功度量方法.pdf 1M

部分页面预览

(完整内容请下载后查看)
12  
Vol. 46 No. 12  
Dec. 2018  
2018  
12  
ACTA ELECTRONICA SINICA  
数据挖掘功  
方法  
1
2
1
3
, , ,  
叶培根 刘 梅  
( 1.  
大学学院  
201210; 2.  
大学通信学院 海  
201210;  
3.  
中国科学院研究院研究中心 上海  
201210)  
:
,  
已广应用于领域 作系有一种能软  
,  
的方法 我们兴趣参与的基础上 提出了一种能克服维度一的方  
法 基于  
DM  
、  
模型 模型相关研究数据挖掘 对项目数据进行主  
,  
成分分考 本文提出一种基数据和统计学法的度度模  
,  
过与用兴趣参与析 证明本文模型于可的  
、 、  
数据 项目的成模型可应用于项目 学术研究 能项目  
领域  
:
; ; ; ; ;  
成分分模型 数据挖掘 量化件工程  
;
DM ;  
模型 力  
关键词  
模型  
:
TP311  
:
A
: 0372-2112 ( 2018) 12-2930-06  
DOI: 10. 3969 /j. issn. 0372-2112. 2018. 12. 015  
中图分类号  
电子学报  
文献标识码  
文章编号  
URL: http: / /www. ejournal. org. cn  
Open Source Software Success Measurement Method Based on  
Mining Software Repository  
1
2
1
3
NING De-jun YE Pei-gen QIN Liu MEI Li  
( 1. School of Software EngineeringTongji UniversityShanghai 201210China;  
2. School of Communication and Information EngineeringShanghai UniversityShanghai 201210China;  
3. Shanghai Advanced Research InstituteChinese Academy of ScienceShanghai 201210China)  
Abstract: The open source software ( OSS) is widely used in various software fieldssuch as operating systemcon-  
taineretc. But there is no method to measure open source software comprehensively. Based on the measurement of user in-  
terest and the development of participation metricswe propose a method that can overcome the single limitation of the met-  
ric dimension. Based on DM modelsoftware viability model and other relevant literature researchmining of software reposi-  
torywe consider the OSS development process and propose an OSS success evaluation model through clusteringprincipal  
component analysis and regression analysis. By comparing the metric score of user interest method and development partici-  
pation methodthe evaluation model can be used to measure the success of OSS projects based on the data collected automat-  
ically without interference. The evaluation model can be applied to select high quality open source projectsacademic re-  
searchintelligent project recommendationetc.  
Key words: open source software; principal component analysis; success measurement model; data mining; quantita-  
tive analysis; software engineering; DM model; software viability model  
: 2017-11-21;  
: 2018-04-11  
:
收稿日期  
修回日期  
基金项目 中国科学院科技项  
( No. 1751110730317511110202) ;  
责任编辑 覃怀银  
:
( No. XDA06000000) ;  
( No. 2016YFB1000805) ;  
海市 科技计划  
国家重点研发计划项目  
( No. 17YF1420500)  
海市扬帆计划  
研究重点科技项目  
2931  
12  
:
数据挖掘方法  
1
引言  
( OSS)  
发展影  
件  
些经件工程  
项目传统件工项目中式  
和过也没传统的  
但所与传统商  
学 术 广 泛  
12]  
注  
的成有力的驳斥识  
3]  
然而 率  
论  
参与行为等相关  
;
4]  
项目的评估不同于商  
是较高的  
统  
的项目状态项目的发展  
F
5]  
度  
生  
success  
所以需一种方法能知当前  
统进行指开成  
, ,  
程度 那么设成开  
6]  
情况 以便所需的项目  
. DeLone  
McLean  
、 、  
中的项目相关  
DM  
. Polancic  
提  
提出了息系的  
模型  
间的关系形式化  
7]  
8]  
. Rajdeep Grewal et al.  
项目模型  
( 1) :  
为式  
技术两个项目的成功  
F
= f( f f f f )  
op  
( 1)  
success  
dev  
pop  
vit  
Github  
本文从  
区软进过的  
数据挖掘的  
数据数据挖掘的方法一种能够  
方法出定价 结分  
的成进行量化行  
方法 使了解开  
3
模型验证  
的成程度确影响成  
随着发展平  
的  
, ,  
的日熟 与传统件工程相发  
动  
大的我们过  
2
项目度量概模型  
数据挖掘技术了解项  
数据采用析  
不同能的  
2
程如图 所示  
:
员 每采用并行同  
机制 并将交给项目的队  
9]  
1 ,  
如图 所示 件  
最好布  
(
生态模型 称  
OSSEM)  
者  
, ,  
获  
10]  
并使用成  
并行协  
、  
代  
码和工件使用并  
螺旋发展的生态  
境  
过文量  
3. 1  
数据过程  
数据包含  
follower  
、 、  
模型参与和项目的  
27  
项目的详细数据  
1000 ,  
的项目 得到  
技术及其相关的分析  
中通取  
前  
因此 结合生态模型的  
32000  
随后这  
1000  
注  
件工本文进行了以下设  
:
23  
( 1) H1:  
机采约  
项目 分  
情况如所示 选取的项目好地反  
github  
影响周  
1
;
数据的方中  
( 2) H2:  
项目的情况  
影响功与源  
出  

全部评论(0)

暂无评论