当前位置: 首页> 书评> 正文

开发自己的搜索引擎--Lucene 2.0+Heriterx《比较一般》

  • 小小评论家小小评论家
  • 书评
  • 2023-03-26 03:49:35
  • 81

或者是因为期望比较高,所以失望比较大。

这本书对Lucene和Heritrix,HTMLParser等等开源工具做了一些介绍,并不怎么深入。

而且实际没有完整地给出一个搜索引擎的框架。虽然有一个可以进行搜索的例子,但是离一个可用的搜索引擎还是比较远的。

例如我想一个搜索引擎最少内部的模块是互相可以通信一起工作的,但是作者实际用了Heritrix抓了数据存在本地的文件里,再用HTMLParser去处理本地的文件,再用Lucence去做索引。实际几个部分是独立的,并没有成为一个真正的系统。这也是我觉得作者实际对这几个程序的使用并不怎么深入的原因。

阅读全文