1、安装依赖的库
需要安装bzip2和zlib
zlib很简单,yum搞定:
yum install zlib-devel
但是yum上的bzip2似乎不符合作者推荐的版本最低要求,所以手动安装吧……
wget http://www.bzip.org/1.0.5/bzip2-1.0.5.tar.gz
tar -xzvf bzip2-1.0.5.tar.gz
cd bzip2-1.0.5
make -f Makefile-libbz2_so
make in[......]
1、安装依赖的库
需要安装bzip2和zlib
zlib很简单,yum搞定:
yum install zlib-devel
但是yum上的bzip2似乎不符合作者推荐的版本最低要求,所以手动安装吧……
wget http://www.bzip.org/1.0.5/bzip2-1.0.5.tar.gz
tar -xzvf bzip2-1.0.5.tar.gz
cd bzip2-1.0.5
make -f Makefile-libbz2_so
make in[......]
关于TC中的Bucket的大小设置。
作者原文如下:
Tokyo Cabinet attains improvement in retrieval by loading RAM with the whole of a bucket array. If a bucket array is on RAM, it is possible to access a region of a target record by about one path of file operations. A[......]
我们来进行一些测试,论证是否有必要采用NoSQL。
因为没有条件造成同时并发读、写,因此暂时只测试单独的读和写。
MySQL
数据量:195W(行)
表结构:
ID(自增)
P_ID(逻辑上外键于另外一个表,考虑到效率,这里我们没有做这个外键)
URL(网页的URL)
主要测试的业务逻辑:根据某个P_ID来找出所有URL
插入速度:每秒1K行左右。
没有索引时候: 10.204(s) 10.172(s) 10.078(s)
对P_ID[......]
deb软件包命名规则:
Ubuntu软件包命名遵循下列约定: <1>_<2>-<3>_<4>.deb
* <1>软件包名称(Package Name):
* <2>版本(Version Number):
* <3>修订号(Build Number):
* <4>平台(Architecture):
o i386
o all: 平台无关. 即适用于所有平台.[......]
5.1 Filed的Cache
有时,存在这样的需求:快速的访问每个Document的Field,但是Lucene只是做了反向索引,因此这种正向索引非常耗时。
Stored fields是一种解决方法,但是也很慢,特别当量大的时候,占用很多内存。
Field的Cache能很好地解决这个问题。
要求
Document必须只有一个Token!
用法
float[] weights = FieldCache.DEFAULT.getFloats(reader, “[......]