Elasticsearch检索分类深入详解—基础篇

时间:2022-05-04
本文章向大家介绍Elasticsearch检索分类深入详解—基础篇,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

Elasticsearch中当我们设置Mapping(分词器、字段类型)完毕后,就可以按照设定的方式导入数据。

有了数据后,我们就需要对数据进行检索操作。根据实际开发需要,往往我们需要支持包含但不限于以下类型的检索: 1)精确匹配,类似mysql中的 “=”操作; 2)模糊匹配,类似mysql中的”like %关键词% “查询操作; 3)前缀匹配; 4)通配符匹配; 5)正则表达式匹配; 6)跨索引匹配; 7)提升精读匹配。

细数一下,我们的痛点在于: 1)ES究竟支持哪些检索操作?

2)如何实现ES精确值检索、指定索引检索、全文检索?

这些就是本文着重参考ES最新官方文档,针对ES5.X版本探讨的内容。

0、检索概览

检索子句的行为取决于查询应用于过滤(filter)上下文还是查询/分析(query)上下文。

过滤上下文——对应于结构化检索 1)核心回答的问题是:“这个文档是否符合这个查询条款?

2)答案是简单的是或否,不计算分数。

3)过滤器上下文主要用于过滤结构化数据。类似于Mysql中判定某个字段是否存在: 例如:

  1. 时间戳字段:是否属于2015年或2016年?
  2. 状态字段:是否设置为“已发布”?

经常使用的过滤器将被Elasticsearch自动缓存,以加快性能。

分析上下文——对应于全文检索 1)核心回答了“本文档与此查询子句是否匹配?”的问题。

2)除了决定文档是否匹配之外,查询子句还会计算一个_score,表示文档与其他文档的匹配程度。

综合应用场景如下:

GET /_search
{  "query": {  "bool": {  "must": [
  { "match": { "title": "Search" }},
  { "match": { "content": "Elasticsearch" }}
  ],  "filter": [
  { "term": { "status": "published" }},
  { "range": { "publish_date": { "gte": "2015-01-01" }}}
  ]
  }
  }
}

以上检索,title中包含"Search”并且content中包含 “Elasticsearch”,status中精确匹配”published”,并且publish_date 大于“2015-01-01”的全部信息。

以下,以“脑图”的形式直观展示检索分类。

其中,3-7随着我开发深入再做更新。