Python中Dictionary的sort by key和sort by value（排序）

Python中的Dictionary类似于C++ STL中的Map

Sort by value
#remember to import
from operator import itemgetter
dict={.....}

#sort by value
sorted(dict.items(), key=itemgetter(1), reverse=True)
Sory by Key
#sort by key
sorted(d.items())[......]

Python中正则表达式用法

数据格式：
<PAIR>
<TEXT>AAA</TEXT>
<LINK>BBB</LINK>
</PAIR>
......

<PAIR>
<TEXT>XXX</TEXT>
<LINK>YYY</LINK>
</PAIR>
代码：特别注意re.DOCALL
def getAnchors(self):
te[......]

一条语句搞定：
:g/^\s*$/d[......]

由于TT对于长文本做Key的存储不太给力（或者是数据分布的问题？）

总之可能要用Hash算法了，MD5不在考虑之列，因为太长。

准备用某种UINT64的Hash算法，然后转为62进制编码，你懂得……

以下内容为转载：

常用的字符串Hash函数还有ELFHash，APHash等等，都是十分简单有效的方法。这些函数使用位运算使得每一个字符都对最后的函数值产生影响。另外还有以MD5和SHA1为代表的杂凑函数，这些函数几乎不可能找到[......]

有的时候，我们需要对多个字符进行逐一替换，一个应用场景就是去掉文章中所有的换行。

而用正则神马的有点大才小用，而一个一个replace也很麻烦，translate提供了这样的功能。
>>> str = " a\tb\rc\n "
>>> print str
ca b

#创建翻译（替换）表，并替换，搞定
>>> import string
>>> tb = string.maketrans("\r\n\t[......]