Mahout – Clustering (聚类篇)

什么是Mahout?

” Apache Mahout™ project’s goal is to build a scalable machine learning library ”

我来拓展一下:
(1) Mahout 是Apache旗下的开源项目,集成了大量的机器学习算法。
(2) 大部分算法,可以运行在Hadoop上,具有很好的拓展性,使得大数据上的机器学习成为可能。

本篇主要探讨 Mahout 0.9 中的聚类(Clustering)工具的用法。

一、数据准[......]

继续阅读

Python中动态计算数学表达式

动态的意思是这样的需求:

假设,Python本地变量中已经存在了两个变量(不一定时代码中写死的,也可以是程序自动生成的)。
a = 3
b = 4
现在,有一个写了数学表达式的字符串:
'a + b'
则,期望其能输出7。

这个需求要2步完成:

1、生成本地变量a、b。

在实际需求中,变量的值往往也是动态生成,而非写死在代码中。

可以用locals,或者exec完成:
locals()['a'] = 3
exec[......]

继续阅读