推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

ApacheMahout:适合所有人的可扩展机器学习框架

更新时间:2020-08-03 18:15:22 大小:2M 上传用户:xuzhen1查看TA发布的资源 标签:机器学习 下载积分:1分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

在软件的世界中,两年就像是无比漫长的时光。在过去两年中,我们看到了社交媒体的风生水起、大规模集群计算的商业化(归功于 Amazon和 Rackspace这样的参与者),也看到了数据的迅猛增长以及我们诠释这些数据的能力的显著提升。“Apache Mahout简介”最初在developerWorks上发表也已经是两年之前的事情。这之后,Mahout社区(以及项目的代码库和功能)取得了长足的发展。Mahout也得到了全球各地各种规模的企业的积极采用在我撰写的 Apache Mahout简介中,我介绍了许多机器学习的概念以及使用 Mahout提供的一套算法的基础知识。我在那篇文章中介绍的概念仍然有效,但这套算法已经发生了显著的变化这篇文章不会重述基础知识,而是重点关注 Mahout的当前状态,以及如何利用 Amazon的EC2服务和包含700万个电子邮件文档的数据集在一个计算集群上扩展 Mahout如需回顾基础知识,请参阅参考资料部分,特别是 Mahout实战》一书。此外,我假设读者具备 Apache Hadoop和 Map-Reduce范式方面的基本知识。(有关 Hadoop的更多信息,请参阅参考资料部分。)

Mahout在极短的时间内取得了长足的发展。项目的关注点仍然可以归纳为我所说的“3个要点”:协同过滤(推荐机制)、聚类和分类。除此之外,这个项目还增加了其他一些功能。我将重点强调两个领域中的一些关键扩展和改进:机器学习的核心算法(实现),以及包括输入/输出工具、与其他库的集成点和更多参考示例的支持基础架构。然而,务必注意,本文对于现状的叙述并不完整。此外,由于篇幅有限,我只能通过寥寥数语简单介绍各项改进。建议读者阅读Mahout网站的新闻部分和各 Mahout发布版的发布说明,以了解这方面的更多信息

部分文件列表

文件名 大小
ApacheMahout:适合所有人的可扩展机器学习框架.pdf 2M

【关注B站账户领20积分】

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载