Lucene 实战教程第四章详解 Field(字段)域和 IndexableField
herman 6年前 (2018-12-11) 5069浏览
Field 有人称之为字段,也有人称之为域,看个人爱好。在 Lucene 中,Field 域非常的重要。一个文档 Document 可以包括多个 Field,Document 只是 Field 的一个承载体,Field 值即为要索引的内容,也是要...
herman 6年前 (2018-12-11) 5069浏览
Field 有人称之为字段,也有人称之为域,看个人爱好。在 Lucene 中,Field 域非常的重要。一个文档 Document 可以包括多个 Field,Document 只是 Field 的一个承载体,Field 值即为要索引的内容,也是要...
herman 6年前 (2018-12-10) 2599浏览
基于前一章的内容,我们对 Lucene 有了一个大概的了解,本文来一个 Hello World 程序!让我们从此开启 Lucene 的学习模式。 首先,我们新建一个 Maven 项目,然后在 pom.xml 中配置以下内容: <...
herman 6年前 (2018-12-10) 2685浏览
Lucene 近年来越来越火,电商项目基本上都有使用。最近我在优化一些公司内部的系统,其中在搜索模块,我打算使用 Lucene 取代原来的基于 SQL 形式的搜索。本文算是 Lucene中文教程的第一章,认识 Lucene,和它的一些核心类介绍。...
herman 6年前 (2018-12-10) 3918浏览
最近在学习和使用 Lucene,所以我想对 Lucene 的内部实现,它的一些组件等有一系列详细的理解。在上一篇的基础上《详解 org.apache.lucene.analysis.Analyzer 使用教程》我们来说说 Analyzer 的内部...
herman 6年前 (2018-12-07) 3548浏览
我们的电商项目中用到了搜索,搜索功能是基于 lucene 开发的。最近有同事给我说,我们的搜索有问题。我吓了一跳,赶紧问什么问题? 他说,搜索商品后,点击第二页,第三页等出来的内容和第一页一样,翻页无效。 然后,我让他排查一下,他怕查...
herman 6年前 (2018-10-22) 11106浏览
我最不喜欢的事情就是做比较,但是不管工作中还是生活中你都会面临两难的选择!Elasticsearch vs Solr,哪一个更好?他们有什么不同?你应该使用哪一个?且看本文给你指明一个方向! Apache Solr是一个成熟的项目,...
herman 7年前 (2018-06-24) 2815浏览 0评论
Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)...
herman 7年前 (2018-06-24) 3172浏览 0评论
全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选。 它可以快速地储存、搜索和分析海量数据。维基百科、Stack Overflow、Github 都采用它。...
herman 7年前 (2018-06-18) 6871浏览 0评论
今天在使用 elasticsearch 的中文分词时,遇到了 access denied 问题。抛出的异常大概是 java.io.FilePermission,即权限问题。整个异常信息如下: org.sprin...
herman 7年前 (2018-06-18) 5749浏览 0评论
在配置 analysis-ik 插件后,启动 elasticsearch 出现这个异常。org.elasticsearch.bootstrap.StartupException: java.lang.IllegalArgumentExceptio...
herman 7年前 (2018-06-18) 6626浏览 0评论
今天我在安装 elasticsearch 的 analysis-ik 插件后,启动 elasticsearch.bat 报了org.elasticsearch.bootstrap.StartupException: java.lang.Illeg...
herman 7年前 (2018-06-18) 7656浏览 0评论
最近我安装了 elasticsearch head。但是访问http://localhost:9100/却提示“集群值未连接”。由于是第一次使用,所以不清楚具体情况,所以搜索了一些资料,看了 GitHu...
herman 7年前 (2017-10-26) 3303浏览 0评论
HanLP 能够提供自然语言处理,中文分词,词性标注,命名实体识别,依存句法分析,关键词提取,自动摘要,短语提取,拼音,简繁转换等特性。本文主要是 HanLP 的入门介绍篇。 HanLP 全称是Han Language Proce...
herman 7年前 (2017-08-23) 2760浏览 0评论
这篇文章我们将进入 Lucene 的实战阶段,我们将通过 Lucene 的一个简单入门程序,来实现它对全文检索,高效的搜索应用。 下载 http://jakarta.apache.org/lucene/ Lucene中的一些比较...
herman 7年前 (2017-08-22) 3085浏览 0评论
Lucene 使用起来很简单,但是要搞懂它内部的一些算法就很难了。本文将从 Lucene 的架构图来介绍 Lucene 的特点和常用包。 Lucene总的来说是: 一个高效的,可扩展的,全文检索库。 全部用Java实现,...