Lucene 实战教程第五章说说 Index(索引)、Document(文档)、Field(字段)、Term(词条)、Token
herman 6年前 (2018-12-11) 3263浏览
要理解 Lucene,必须要先对它的基本构成有所了解。上一章我写了 Field,有些人还是看不明白,在微信群里讨论。所以,这一章我在把 Lucene 内部的几个概念拿出来讲一讲。 如果这几个概念:索引(index)、段(Segement)、...
herman 6年前 (2018-12-11) 3263浏览
要理解 Lucene,必须要先对它的基本构成有所了解。上一章我写了 Field,有些人还是看不明白,在微信群里讨论。所以,这一章我在把 Lucene 内部的几个概念拿出来讲一讲。 如果这几个概念:索引(index)、段(Segement)、...
herman 7年前 (2017-08-22) 2194浏览 0评论
对文档建立好索引后,就可以在这些索引上面进行搜索了。搜索引擎首先会对搜索的关键词进行解析,然后再在建立好的索引上面进行查找,最终返回和用户输入的关键词相关联的文档。 到这里似乎我们可以宣布“我们找到想要的文档了&rdqu...
herman 7年前 (2017-08-22) 2273浏览 0评论
索引是现代搜索引擎的核心,建立索引的过程就是把源数据处理成非常方便查询的索引文件的过程。为什么索引这么重要呢,试想你现在要在大量的文档中搜索含有某个关键词的文档,那么如果不建立索引的话你就需要把这些文档顺序的读入内存,然后检查这个文章中是不是含有...