1、获取位置
sudo easy_install -m BitVector
....
Using /usr/local/lib/python2.6/dist-packages
....
2、删除egg文件和py、pyc
cd /usr/local/lib/python2.6/dist-packages
rm -rf BitVector-3.0.egg-info
rm BitVector.py
rm BItVecvor.pyc[......]
Bloom Filter实现的一些文章
1、给出了Java实现,用Random做为一致性哈希算法。。。
http://blog.locut.us/2008/01/12/a-decent-stand-alone-java-bloom-filter-implementation/
2、分析比较到位:
http://blog.csdn.net/jiaomeng/article/details/1495500
3、这个写的也不错
http://www.cnblogs.com/heaad/archive/2011/01/02/[......]
实现Bloom Filter必读
众所周知的原因,帮大家把这篇文章转载过来,写的很好。
It seems like Bloom filters are all the rage these days. Three years ago I had barely heard of them and now it seems like I see articles and code using them all the time. That's mostly a good thing, since bloom f[......]
Murmur Hash的Python实现
是最近几年非常火的一种Hash算法,已经升级到3.0,
Hadoop、Kotyo Cabinet等之中都采用了它。
主要是性能非常优秀,且碰撞不高。
Python实现:http://pypi.python.org/pypi/mmh3/2.0
其实我在为写一个自用的Bloom Filter做准备。[......]
使用GenericOptionsParser简化参数解析
GenericOptionsParser可以让你的Map/Reduce程序具有Hadoop常用的属性。
一般无需直接用GenericOptionsParser,继承Configured即可。
public class ConfigurationPrinter extends Configured implements Tool {
//添加你需要的配置文件
static {
Configuration.addDefaultResource("hdfs-default.xml[......]