推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

对基于MPN的相似重复记录识别算法的改进

更新时间:2010-12-28 17:40:01 大小:651K 上传用户:julien查看TA发布的资源 标签:排序 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

相似重复记录识别是数据清理中的一个关键问题。文章针对常用的多趟邻接排序法提出了两点改进:一是在多趟排序识别过程中直接合并有重叠的相似记录集,取消了最后计算传递闭包的环节;二是利用关键字按字典序排序的特

部分文件列表

文件名 大小
对基于MPN的相似重复记录识别算法的改进 651K

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载