首页 | 互联网 | IT动态 | IT培训 | Cisco | Windows | Linux | Java | .Net | Oracle | 软件测试 | C/C++ | 嵌入式开发 | 存储世界 | 服务器
网络设备 | IDC | 安全 | 求职招聘 | 数字网校 | 网页设计 | 平面设计 | 技术专题 | 电子书下载 | 教学视频 | 源码下载 | 搜索 | 博客 | 论坛
中国IT实验室Linux频道
中国IT教育
Google
首页 资讯动态 认证考试 新手入门 核心技术 高级技术 J2EE J2ME Java&XML 开源技术 其他技术 RSS订阅 论坛 专题
您现在的位置: 中国IT实验室 >> Java >> 核心技术 >> 网络编程 >> 正文

用Lucene做一个简单的Java搜索工具

    初学Lucene,刚接触搜索引擎。知道了一点点,想做个小工具,实现根据“单词”搜索某个java源文件。比如输入“String”去查询某些java源文件里用到了这个类。

    这个想法的来源是,在以前刚学java时,有一本java基础教程的书的附带光盘里有作者写的一个程序,可以方便初学者查找某些类在哪个实例里出现。当时没有太在意,觉得作者的代码很长。所以现在想自己也写一个这样的小程序。

    开发工具与运行环境:使用Lucene2.0的包,jdk1.5,在WindowsXP下运行。

    思路分析与设计:

    整个程序里,除了Lucene的必要操作外,就是IO的基本操作了。因为要对某目录下及其子目录下的所有Java源文件进行索引,就要用到递归,同时要过滤掉非Java源文件。根据这种情况,设计了以下5个类。


 
主类:索引类(IndexJavaFiles),搜索类(SearchJavaFiles
异常类:索引异常类(IndexException),搜索异常类(SearchException)
还有一个文件过滤工厂类(FileFilterFactory)。

    异常类不是必要的,特意设计来包装IO异常、文件异常和Lucene的异常。文件过滤工厂类的出现并不是故弄玄虚,只是不想太多代码集中一起,就把文件过虑器的设计放到一个类里。下面是程序的完整代码及注释。

 
IndexJavaFiles.java
/**
 *indexthejavasourcefiles
 */
package powerwind;
 
import java.io.*;
import java.util.Date;
 
import org.apache.lucene.document.*;
import org.apache.lucene.index.IndexWriter;
 
/**
 *@authorPowerwind
 *@version1.0
 */
publicclass IndexJavaFiles {
 
    /**
     *默认构造方法
     */
    public IndexJavaFiles() {
    }
 
    /**
     * 这个私有递归方法由index方法调用,保证index传入的file是目录不是文件
     *
     *@paramwriter
     *@paramfile
     *@paramff
     *@throwsIndexException
     */
    privatevoid indexDirectory(IndexWriter writer, File file, FileFilter filter)throws IndexException {
       if (file.isDirectory()) {
           // 有选择地(过滤)获取目录下的文件和目录
           File[] files = file.listFiles(filter);
           // 非空目录
           if (files != null) {
              for (int i = 0; i < files.length; i++) {
                  indexDirectory(writer, files[i], filter);
              }
           }
       } else {
           try {
             // 这里的file经过先前的过滤
              writer.addDocument(parseFile(file));
              System.out.println("增加文件: " + file);
           } catch (IOException ioe) {
              thrownew IndexException(ioe.getMessage());
           }
       }
    }
 
    /**
     *传参数是文件就直接索引,若是目录则交给indexDirectory递归
     *
     *@paramwriter
     *@paramfile
     *@paramff
     *@throwsIndexException
     */
    publicvoid index(IndexWriter writer, File file, FileFilter filter) throws IndexException {
       // 确定可读
       if (file.exists() && file.canRead()) {
           if (file.isDirectory()) {
              indexDirectory(writer, file, filter);
           } elseif (filter.accept(file)) {
              try {
                  writer.addDocument(parseFile(file));
                  System.out.println("增加文件: " + file);
              } catch (IOException ioe) {
                  thrownew IndexException(ioe.getMessage());
              }
           } else {
              System.out.println("指定文件或目录错误,没有完成索引");
           }
       }
    }
 
    /**
     *@paramfile
     *
     *File变成Document
     */
    private Document parseFile(File file) throws IndexException {
       Document doc = new Document();
       doc.add(new Field("path", file.getAbsolutePath(), Field.Store.YES,
                     Field.Index.UN_TOKENIZED));
       try {
           doc.add(new Field("contents", new FileReader(file)));
       } catch (FileNotFoundException fnfe) {
           thrownew IndexException(fnfe.getMessage());
       }
       return doc;
    }
}
 
 

[1] [2] [3] 下一页

【责编:Peng】

中国IT教育

相关产品和培训
文章评论
 友情推荐链接
 认证培训
 专题推荐

 ·关于Java框架技术专题
 ·XML全攻略技术专题
 ·JAVA开源技术介绍专题
 ·Java嵌入式开发之J2ME技术专题
 ·超前体验 Oracle 11g的5个新特性…
 ·揭密使用VB.NET的五个实用技巧
 ·Oracle和SQL Server常用函数对比专题…
 ·展现C#世界 C#程序设计专题…
 ·Java入门 Tomcat的配置技巧精华专题…
 ·Oracle RMAN物理备份技术详解…
 今日更新
 社区讨论
 博客论点
 频道精选
 Java 频道导航