通过Python接口wx_Oracle访问数据库

Oracle数据库是商业软件,封闭的东西,折腾是难免的。

即使有Python接口,也是依赖Oracle原生类库的。

目前比较流行的Python访问Oracle的接口是:cx Oracle

1、安装instantclient

地址参考之前的一篇文章:《Linux下配置OCI(Oracle调用接口)》

以我的10g为例子,需要下面两个文件:

sdk-10.2.0.5.0-linux-x64.zip  需要这之中的include头文件

basiclite-10[......]

继续阅读

试用开源分词系统SCWS

在前一段时间,使用了贵所的ICTCLAS分词系统,总体下来有两点不太满意:

1、分词速度奇慢,分词速度勉强能达到600KB/s

2、词库拓展麻烦,不加词库则分词效果欠佳。

3、无可用的授权

其实ICTCLAS本身,在贵所内部就存在诸多争议,譬如版权之争……具体细节不方便描述了。

国内有很多人,特别是学术界很推崇ICTCLAS,大家都觉得隐马是高级算法,效果自然会很好,譬如这篇很偏激的争论帖子:

http://www.oschina.net/question/9[......]

继续阅读

使用flock实现脚本互斥执行

还是在上午配置实验室服务器rsync的时候,发现如果目标文件非常多的时候,crontab中执行一次rsync的速度会很慢,这样很可能发生“追 尾”。

其实,我们可以用Linux下自带的flock命令在shell中实现互斥执行

flock (util-linux 2.13-pre7)
Usage: flock [-sxun][-w #] fd#
flock [-sxon][-w #] file [-c] command...
-s --shared G[......]

继续阅读

配置rsync+ssh+密码登录

原创,转载请注明:配置rsync+ssh+密码登录

配置rsync+ssh+密码登录 - rsync over SSH using sshpass

rsync是Linux下非常好用的开源工具。
rsync的更新是差量的,即有变化的文件才更新,最大程度的减少了数据传输量和时间。
但是配置起来比较繁琐。即需要rsyncd和rsync共同配置。

实际上,rsync是支持ssh协议的,只要走ssh协议就可以了。走ssh协议速度稍慢一些,但是配置非常简单。
同时,ssh协议的缺点就[......]

继续阅读