解剖 Lucene 的总体架构
herman 7年前 (2017-08-22) 3080浏览 0评论
Lucene 使用起来很简单,但是要搞懂它内部的一些算法就很难了。本文将从 Lucene 的架构图来介绍 Lucene 的特点和常用包。 Lucene总的来说是: 一个高效的,可扩展的,全文检索库。 全部用Java实现,...
herman 7年前 (2017-08-22) 3080浏览 0评论
Lucene 使用起来很简单,但是要搞懂它内部的一些算法就很难了。本文将从 Lucene 的架构图来介绍 Lucene 的特点和常用包。 Lucene总的来说是: 一个高效的,可扩展的,全文检索库。 全部用Java实现,...
herman 7年前 (2017-08-22) 5923浏览 0评论
不管你是用百度还是谷歌,都有一套权重算法。以百度为例,权重越高,搜索出来的结果排名就越靠前。同理 Lucene 的对搜索结果是如何排序的呢?答案是对搜索词的权重(Term weight)计算。本文将介绍一下 Lucene 的权重(PR)计算方式。...
herman 7年前 (2017-08-22) 2194浏览 0评论
对文档建立好索引后,就可以在这些索引上面进行搜索了。搜索引擎首先会对搜索的关键词进行解析,然后再在建立好的索引上面进行查找,最终返回和用户输入的关键词相关联的文档。 到这里似乎我们可以宣布“我们找到想要的文档了&rdqu...
herman 7年前 (2017-08-22) 5122浏览 0评论
还有不了解 Lucene 的,可以先看我前面一篇关于 Lucene 简介的文章《Apache Lucene 简介》。本文将详细的介绍 Lucene 的原理和实现机制,以及 Lucene 和数据库的对比。 目前已经有很多应用程序的搜索功能是基...
herman 7年前 (2017-08-22) 3470浏览 0评论
目前越来越多的项目加入 Apache Lucene 框架,以实现全文检索的功能。本文将主要介绍Lucene 是什么?Lucene的作者简介,Lucene的发展历程,以及使用Lucene比较著名的项目。 Lucene 是什么...