Python中的Dictionary类似于C++ STL中的Map
Sort by value
#remember to import
from operator import itemgetter
dict={.....}
#sort by value
sorted(dict.items(), key=itemgetter(1), reverse=True)
Sory by Key
#sort by key
sorted(d.items())[......]
Python中的Dictionary类似于C++ STL中的Map
Sort by value
#remember to import
from operator import itemgetter
dict={.....}
#sort by value
sorted(dict.items(), key=itemgetter(1), reverse=True)
Sory by Key
#sort by key
sorted(d.items())[......]
数据格式:
<PAIR>
<TEXT>AAA</TEXT>
<LINK>BBB</LINK>
</PAIR>
......
<PAIR>
<TEXT>XXX</TEXT>
<LINK>YYY</LINK>
</PAIR>
代码:特别注意re.DOCALL
def getAnchors(self):
te[......]
一条语句搞定:
:g/^\s*$/d[......]
由于TT对于长文本做Key的存储不太给力(或者是数据分布的问题?)
总之可能要用Hash算法了,MD5不在考虑之列,因为太长。
准备用某种UINT64的Hash算法,然后转为62进制编码,你懂得……
以下内容为转载:
转载自:
各种字符串Hash函数比较
常用的字符串Hash函数还有ELFHash,APHash等等,都是十分简单有效的方法。这些函数使用位运算使得每一个字符都对最后的函数值产生 影响。另外还有以MD5和SHA1为代表的杂凑函数,这些函数几乎不可能找到[......]
有的时候,我们需要对多个字符进行逐一替换,一个应用场景就是去掉文章中所有的换行。
而用正则神马的有点大才小用,而一个一个replace也很麻烦,translate提供了这样的功能。
>>> str = " a\tb\rc\n "
>>> print str
ca b
#创建翻译(替换)表,并替换,搞定
>>> import string
>>> tb = string.maketrans("\r\n\t[......]