Author Archives: coder4

Lucene in Action(2nd)--第二章 索引

2.1  从概念理解Lucene的Index(索引)文档模型
Lucene主要有两种文档模型:Document和Field,一个Document可能包含若干个Field。

每一个Field有不同的策略:

1.被索引 or not,将该字段(Field)经过分析(Analyisi)后,加入索引中,并不是原文。

2.如果被索引,可选择是否保存“term vector”(向量),用于相似检索。

3.可选择是否存储(store),将原文直接拷贝,不做索引,用于检索后的取出。[......]

继续阅读