Elasticsearch 崛起的那些事!
herman 5年前 (2019-07-05) 1939浏览
Elasticsearch 是一个后起之秀!在它推出之前,已经有了 Solr、Lucene 等框架,可依然阻挡不了 Elasticsearch 的崛起! 在技术领域,语言与语言之间有竞争,框架与框架之间有竞争,社区与社区之间也有竞争,Elas...
herman 5年前 (2019-07-05) 1939浏览
Elasticsearch 是一个后起之秀!在它推出之前,已经有了 Solr、Lucene 等框架,可依然阻挡不了 Elasticsearch 的崛起! 在技术领域,语言与语言之间有竞争,框架与框架之间有竞争,社区与社区之间也有竞争,Elas...
herman 5年前 (2019-06-28) 2495浏览
昨天,很多买了 Elasticsearch 的网友,在群里问:“Elasticsearch 中的索引为什么叫倒排索引?很难理解!” 这一问,立马引起了很多人的注意,包含很多没关注过倒排索引的人。今天我们一起来看看,为什么叫倒排索引? 有...
herman 5年前 (2019-06-27) 3168浏览
Elasticsearch 是上市公司 Elastic 开源的一个产品。而 Elasticsearch 支撑了整个 Elastic 公司的大约 50 亿美元的市值,这个市值超过大多数 A 股公司。这足以说明了 Elasticsearch 的商业价值...
herman 5年前 (2019-06-24) 5424浏览
搜索是现代软件必备的一项基础功能,而 Elasticsearch 就是一款功能强大的开源分布式搜索与数据分析引擎。 它可以从海量数据中快速找到相关信息,在同领域内几乎没有竞争对手——近两年 DBRanking 的数据库评测中,ES 在搜索引擎...
herman 6年前 (2019-06-13) 24198浏览
最近,交大因为对 ElasticSearch 数据库未正确配置公开访问权限,导致泄漏了 8.4TB 的电子邮件元数据。一时间各大媒体相互报道,看客们一个个很热闹! 之前,就有互联网知名团队报道过,因为 MongoDB、ElasticSearc...
herman 6年前 (2018-12-14) 4621浏览
网上搜索了一下关于 Lucene 教程的文章非常多,但是关于 SpringBoot 整合 Lucene 的非常少,可能一些涉及到搜索的项目都比较老,使用 Lucene 的比较少,使用 Solr 和 Elasticsearch 的可能比较多。但是文...
herman 6年前 (2018-12-13) 3773浏览
在某些需求场景下,我们可能需要禁用模糊查询 FuzzyQuery 和通配符查询 WildcardQuery,那通过 QueryParser 该怎么做呢? 答案就是重写 QueryParser 类。实现自己的 QueryParser 类,并将...
herman 6年前 (2018-12-13) 2121浏览
Lucene 中的 IndexSearcher 提供了一整套完整的搜索体系,这套查询体系是建立在 SpanQuery 类的基础上。SpanQuery 类大致的反映了 Lucene 的 Query 类体系。今天我们一起来学习学习 SpanQuery...
herman 6年前 (2018-12-13) 3384浏览
所有建立索引的目的就是为了检索。 索引一般只需要建立一次,但是搜索才是核心。建立索引的目的就是为了检索。IndexSearcher 索引搜索器是 Lucene 中核心的核心,是搜索过程中最重要的和核心组件。本文...
herman 6年前 (2018-12-12) 2880浏览
从教程的第一篇到现在,大家可能会发现一个问题。那就是所有的 Document 文档或者 Field 字段都使用的是同一个分词器。那么有没有办法让不同的 Field 使用不同的分词器呢? 答案就是 PerFieldAnalyzerWrappe...
herman 6年前 (2018-12-12) 2379浏览
在 Lucene 中,不仅 TokenFilter 我们可以自定义,Analyzer 我们也可以自定义。本文介绍两个扩展 Analyzer 的例子,分别实现扩展停用词,实现字长过滤的功能。 自定义 Analyzer 自定义 Analy...
herman 6年前 (2018-12-12) 3412浏览
当你深入骨髓的去了解一项技术,你才能获得快感!上一章,我们说过 Analyzer 分词器的主要是用来构建 TokenStreams,那么我们今天就一起通过本文来看看 Analyzer 的内部构造,TokenStream 和 TokenFilter...
herman 6年前 (2018-12-12) 2519浏览
这一章也不算是什么新的内容了,前面我已经写过两篇关于 Analyzer 的内容了。它们分别是《深入理解 Lucene 的 Analyzer》、《详解 org.apache.lucene.analysis.Analyzer 使用教程》。这篇文章,我...
herman 6年前 (2018-12-12) 4085浏览
所有的搜索基本上都存在精确匹配,包含等操作。Lucene 中同样存在这样的操作,今天我们以 IntPoint 为例,来说说 Lucene 中的精确查询。 IntPoint、LongPoint、FloatPoint、DoublePoint 这...
herman 6年前 (2018-12-11) 3266浏览
要理解 Lucene,必须要先对它的基本构成有所了解。上一章我写了 Field,有些人还是看不明白,在微信群里讨论。所以,这一章我在把 Lucene 内部的几个概念拿出来讲一讲。 如果这几个概念:索引(index)、段(Segement)、...