Tag Archives: 技巧

Linux sort的四个小技巧

像排序这种事情,用C/C++可以写,但很麻烦,交给sort就好了,功能很强大的。

1、按照多个列排序(列间空格分开):

测试数据:

先按照第1列排序,再第2列的命令:

2011-11-20补充:必须加-s选项,表示stable sort,即两列排序互相不打扰。
$ cat ./test
1       x
5       8
1       a

$ sort -s -k 1 -k 2 ./test
1       a
1       x
5      [……]

继续阅读

[转]Python写爬虫抓站的一些技巧

转载自:http://blog.csdn.net/sding/archive/2011/02/28/6214207.aspx

1.最基本的抓站

import urllib2
content = urllib2.urlopen(‘http://XXXX’).read()


2.使用代理服务器
这在某些情况下比较有用,比如IP被封了,或者比如IP访问的次数受到限制等等。

import urllib2
proxy_support = urllib2.Pro[……]

继续阅读