是最近几年非常火的一种Hash算法,已经升级到3.0,
Hadoop、Kotyo Cabinet等之中都采用了它。
主要是性能非常优秀,且碰撞不高。
Python实现:http://pypi.python.org/pypi/mmh3/2.0
其实我在为写一个自用的Bloom Filter做准备。[......]
是最近几年非常火的一种Hash算法,已经升级到3.0,
Hadoop、Kotyo Cabinet等之中都采用了它。
主要是性能非常优秀,且碰撞不高。
Python实现:http://pypi.python.org/pypi/mmh3/2.0
其实我在为写一个自用的Bloom Filter做准备。[......]
由于TT对于长文本做Key的存储不太给力(或者是数据分布的问题?)
总之可能要用Hash算法了,MD5不在考虑之列,因为太长。
准备用某种UINT64的Hash算法,然后转为62进制编码,你懂得……
以下内容为转载:
转载自:
各种字符串Hash函数比较
常用的字符串Hash函数还有ELFHash,APHash等等,都是十分简单有效的方法。这些函数使用位运算使得每一个字符都对最后的函数值产生 影响。另外还有以MD5和SHA1为代表的杂凑函数,这些函数几乎不可能找到[......]
明天考试,可以带电脑,先写好了程序,省的按计算器……直接上Python的源代码。
[python]
#Naive Bayes
#Calculate the Prob. of class:cls
def P(data,cls_val,cls_name="class"):
cnt = 0.0
for e in data:
if e[cls_name] == cls_val:
cnt += 1[......]
http://www.coder4.com/tools_ip_32int.php
可能大小端还有一些问题,还在考虑中。
例如将字符串“127.0.0.1”转化为32位无符号整数2130706433[......]
Crypto++理论上可以在任何平台上编译,但是作者似乎是个Windows控,默认只生成静态库。当在Linux下编译的时候,需要打个patch给GNUmakefile,然后才能生成.so动态库。
补丁见这里,请爬梯子,注意安全~
http://groups.google.com/group/cryptopp-users/browse_thread/thread/6d37437aa40fc135?pli=1
对了,编译时候记得参数
-lcryptopp -lpthread
包装类RSATool[......]