标签:Analyzer

JAVA

Elasticsearch 7.x 版本安装和插件离线安装教程

herman 5年前 (2019-06-26) 7205浏览

最近我在极客时间上学习 Elasticsearch,作者使用的版本,主要是 Elasticsearch 7.1。这里我根据作者教程,我自己整理了一个安装教程。希望对大家有所帮助! 写这个教程的主要原因是,很多人在安装的过程中出错!而我本人是 ...

JAVA

Lucene 实战教程第九章自定义 Analyzer

herman 6年前 (2018-12-12) 2379浏览

在 Lucene 中,不仅 TokenFilter 我们可以自定义,Analyzer 我们也可以自定义。本文介绍两个扩展 Analyzer 的例子,分别实现扩展停用词,实现字长过滤的功能。 自定义 Analyzer 自定义 Analy...

JAVA

Lucene 实战教程第三章创建索引 IndexWriter

herman 6年前 (2018-12-10) 2967浏览

我在前面介绍过,所有的搜索技术大部分都是靠索引来实现,所以索引很重要。于是我就把索引这一块单独的抽取出来作为一章来写。 通过上面这张流程图,我们也可以看出索引对于 Lucene 的重要性。 全文检索的流程分为两大部分:索引流程...

JAVA

Lucene 实战教程第二章入门教程 Hello World

herman 6年前 (2018-12-10) 2599浏览

基于前一章的内容,我们对 Lucene 有了一个大概的了解,本文来一个 Hello World 程序!让我们从此开启 Lucene 的学习模式。 首先,我们新建一个 Maven 项目,然后在 pom.xml 中配置以下内容: <...

JAVA

深入理解 Lucene 的 Analyzer

herman 6年前 (2018-12-10) 3923浏览

最近在学习和使用 Lucene,所以我想对 Lucene 的内部实现,它的一些组件等有一系列详细的理解。在上一篇的基础上《详解 org.apache.lucene.analysis.Analyzer 使用教程》我们来说说 Analyzer 的内部...

JAVA

Lucene 中文词汇分词(Word Segment)问题总结

herman 7年前 (2017-08-22) 2721浏览 0评论

对于中文来说,全文索引首先还要解决一个语言分析的问题,对于英文来说,语句中单词之间是天然通过空格分开的,但亚洲语言的中日韩文语句中的字是一个字挨一个,所有,首先要把语句中按“词”进行索引的话,这个词如何切分出来就是一个很大...