Java搜索引擎开发(第1部分)

本项目使用Lucene 2.0、JE-Analysis 1.5和Heritrixs,并在Eclipse中直接导入工程。包含种子文件seeds.txt以及Heritrixs的JOB配置文件conf.xml。项目功能涵盖网页抓取、索引和检索,因项目较大,分为两个部分,本部分为第1部分。
rar 文件大小:7MB