《Lucene In Action》第四章.Analysis(分词)

简单来说,Analysis就是把field Text转化成基本的Term的形式。

通过分词,将Text转化为Token,Token+对应的Field即为Term。

分词的处理包括:萃取、丢弃标点、移除发音、小写、移除常用单词、去除变形(去掉过去时等)等。

本章将介绍如何使用内置的分词器,以及如何根据语言、环境等特点创建自己的分词器。
4.1  使用Analysis
分词用于所有需要将Text转化成Term的场合,在Lucene中主要有两个:

1、Index(索引)[......]

继续阅读

Ubuntu配置VPN

Ubuntu配置VPN,一开始是灰色的,不可用。。需要安装一些东西。

起初Network Configuration中VPN标签是灰色不可用状态,因为ubuntu默认没有安装任何相应协议的网络管理器。

$ sudo apt-get install network-manager-pptp // 安装PPTP协议管理器

$ sudo apt-get install network-manager-openvpn // 安装OpenVPN协议管理器

$ sudo Networ[......]

继续阅读

《Lucene In Action》第三章.搜索

主要的类

IndexSearcher:搜索的主类。

Query(及具体子类):被传入IndexSearcher的search方法,用于逻辑上的搜索。

QueryParser:将人工输入的查询字符串转化成Query对象。

TopDocs:存储着得分最高的那些文档,由IndexSearcher的search方法返回。

ScoreDoc:TopDocs中的每一个文档,他们只保留着Document的引用。
3.1 实现简单的索引功能
可以通过符合Lucene的字符串或者[......]

继续阅读

Ubuntu下配置tftp服务器

1、安装
[bash]
sudo apt-get install tftp tftpd xinetd
[/bash]
2、新建目录
[bash]
mkdir /home/liheyuan/tftpd/
chmod 777 /home/liheyuan/tftpd/
sudo chown -R nobody /home/liheyuan/tftpd/
[/bash]
3、配置
创建/etc/xinetd.d/tftp
内容如下:
[bash]
service tftp[......]

继续阅读