或者是因为期望比较高,所以失望比较大。
这本书对Lucene和Heritrix,HTMLParser等等开源工具做了一些介绍,并不怎么深入。
而且实际没有完整地给出一个搜索引擎的框架。虽然有一个可以进行搜索的例子,但是离一个可用的搜索引擎还是比较远的。
例如我想一个搜索引擎最少内部的模块是互相可以通信一起工作的,但是作者实际用了Heritrix抓了数据存在本地的文件里,再用HTMLParser去处理本地的文件,再用Lucence去做索引。实际几个部分是独立的,并没有成为一个真正的系统。这也是我觉得作者实际对这几个程序的使用并不怎么深入的原因。
本文由作者笔名:小小评论家 于 2023-03-26 03:49:35发表在本站,文章来源于网络,内容仅供娱乐参考,不能盲信。
本文链接: http://www.w2mh.com/show/16277.html