Tag Archives: 数据挖掘

Mahout - Clustering (聚类篇)

什么是Mahout?

" Apache Mahout™ project's goal is to build a scalable machine learning library "

我来拓展一下:
(1) Mahout 是Apache旗下的开源项目,集成了大量的机器学习算法。
(2) 大部分算法,可以运行在Hadoop上,具有很好的拓展性,使得大数据上的机器学习成为可能。

本篇主要探讨 Mahout 0.9 中的聚类(Clustering)工具的用法。

一、数据准[......]

继续阅读