微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

ElasticSearch搜索引擎一

目录

一、建索引需要了解

settings:配置信息
number_of_replicas: 0 不需要备份(单节点的ElasticSearch使用)
mappings: 映射内容
dynamic:false 是否动态索引,这里使用的是false,表示索引的固定的,不需要修改。
properties: 属性结构内容
index:true 需要分词处理的结构
type:对应的数据类型,text文本(长字符串),integer数字,date时间,keyword单词
analuzer:采用的分词器

二、基础操作

1.添加索引

{
    "mappings": {
        "properties": {
            "id": {
                "type": "long",
                "store": true,
                "index": false
            },
            "title": {
                "type": "text",
                "store": true,
                "index": true,
                "analyzer": "standard"
            },
            "content": {
                "type": "text",
                "store": true,
                "index": true,
                "analyzer": "standard"
            }
        }
    }
}

添加成功:

{
    "ackNowledged": true,
    "shards_ackNowledged": true,
    "index": "blog2"
}
2.删除索引

3.添加文档

使用ElasticSearch-Head图形化工具查看

4.修改文档

查看

5.删除文档

6.查询文档
  • 根据id查

  • 根据QueryString

搜索内容"分布式全文检索引擎"修改为"搜索",同样也搜索到文档,这是为什么?

查询结果为0

搜索内容"分布式全文检索引擎"修改为"搜索",同样也不能搜索到文档,这又是为什么?

三、IK分词器与ES集成

在进行字符串查询时,我们发现去搜索"搜索服务器"和"搜索"都可以搜索到数据,而在进行词条查询时,我们都没有搜索到数据;

究其原因是ElasticSearch的标准分词器导致的,当我们创建索引时,字段使用的是标准分词器:

"analyzer": "standard"

现对 "分布式全文检索引擎" 进行标准分词器分词 ,测试效果

发现standard对中文支持不够良好

1.IKAnalyzer简介

一个开源的,基于java语言开发的轻量级的中文分词工具包。提供了对 Lucene的认优化实现。

2.IK分词器安装

下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases/

下载完成将解压到elasticsearch-7.5.2\plugins下,并重新启动es服务

3.IK分词器测试

IK提供了两个分词算法ik_smartik_max_word ,其中 ik_smart 为最少切分,ik_max_word为最细粒度划分

分词效果ik_smart 是:分布式—全文—检索—引擎,ik_max_word 是:分布式—分布—式—全文—检索—引擎,还是有区别的..

4.重新配置索引映射mapping并添加文档
 "analyzer": "ik_max_word"

再次测试:

而用term就能搜索出来

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐