Elastic boosting的使用

boosting介绍

Boosting查询允许您降低与负面查询匹配的文档的相关性评分

boosting语法

GET /_search
{
  "query": {
    "boosting": {
      "positive": {
        "term": {
          "text": "apple"
        }
      },
      "negative": {
        "term": {
          "text": "pie tart fruit crumble tree"
        }
      },
      "negative_boost": 0.5
    }
  }
}
关键词 语法介绍
positive 这是主要要匹配的查询 ,只会展示positive 条件匹配的结果
negative 这是要降低相关性分数的查询
negative_boost 一个在0到1之间的值,用于降低与negative查询匹配的文档的相关性评分

查询流程

  1. 执行正向(Positive)查询 ElasticSearch首先执行正向查询,获取与之匹配的文档集合。这个查询是Boosting查询的主要部分。
  2. 执行反向(Negative)查询 然后,ElasticSearch执行反向查询,获取与之匹配的文档集合。这个查询是用来降低与之匹配文档的相关性分数。
  3. 计算相关性分数 对于每个文档,ElasticSearch计算其相对于正向查询的相关性分数。如果该文档也与反向查询匹配,则其分数会根据negative_boost的值进行降低。
  4. 如果一个文档只与正向查询匹配,则保留原始分数不变
  5. 如果一个文档既与正向查询又与反向查询匹配,则按new_score = old_score * negative_boost计算新的降低后的分数
  6. 排序返回结果 最后,ElasticSearch根据计算出的新相关性分数对匹配文档进行排序,并返回结果。

案例

场景

某电商网站,用户搜索"手机",我们希望对下面几种情况的商品评分分别进行调整:

  1. 如果是苹果手机,给予相对较高的权重
  2. 如果是较新的手机型号(2022年后上市),也给予较高权重
  3. 如果有"旗舰"、"Pro"等词,视为较高端机型而增加权重
  4. 如果是品牌为"X"的机型,则降低权重

索引创建

PUT /products
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text"
      },
      "brand": {
        "type": "keyword"
      },
      "release_date": {
        "type": "date"
      }
    }
  }
}

文档插入

POST /_bulk
{"index":{"_index":"products"}}
{"name":"iPhone 14 Pro Max","brand":"Apple","release_date":"2022-09-15"}
{"index":{"_index":"products"}}
{"name":"小米12S Ultra","brand":"Xiaomi","release_date":"2022-07-04"}
{"index":{"_index":"products"}}
{"name":"华为Mate 50 Pro","brand":"Huawei","release_date":"2022-11-28"}
{"index":{"_index":"products"}}
{"name":"X品牌旗舰新机","brand":"X","release_date":"2021-06-01"}
{"index":{"_index":"products"}}
{"name":"三星Galaxy S23 Ultra","brand":"Samsung","release_date":"2023-02-17"}
{"index":{"_index":"products"}}
{"name":"魅族 Pro 7S","brand":"Meizu","release_date":"2020-05-28"}

查询语句

GET products/_search
{
  "query": {
    "boosting": {
      "positive": {
        "bool": {
          "should": [
            {
              "term": {
                "brand": {
                  "value": "Apple"
                }
              }
            },
            {
              "range": {
                "release_date": {
                  "gte": "2022-01-01"
                }
              }
            },
            {
              "regexp": {
                "name": ".*旗舰|Pro.*"
              }
            }
          ]
        }
      },
      "negative": {
        "term": {
          "brand": {
            "value": "Xiaomi"
          }
        }
      },
      "negative_boost": 0.5
    }
  }
}

相关推荐

  1. ThreadLocal使用以及使用场景

    2024-03-14 09:56:01       25 阅读
  2. git使用

    2024-03-14 09:56:01       71 阅读
  3. websoket 使用

    2024-03-14 09:56:01       55 阅读
  4. Logstash使用方法

    2024-03-14 09:56:01       66 阅读
  5. Auth使用、缓存

    2024-03-14 09:56:01       55 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-14 09:56:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-14 09:56:01       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-14 09:56:01       82 阅读
  4. Python语言-面向对象

    2024-03-14 09:56:01       91 阅读

热门阅读

  1. vue element input让浏览器不保存密码

    2024-03-14 09:56:01       41 阅读
  2. Redis实现全局唯一id

    2024-03-14 09:56:01       42 阅读
  3. Redisson

    2024-03-14 09:56:01       42 阅读
  4. Http 请求状态码

    2024-03-14 09:56:01       43 阅读
  5. 前端框架的发展史

    2024-03-14 09:56:01       35 阅读
  6. git命令行提交——github

    2024-03-14 09:56:01       44 阅读
  7. react diff 原理

    2024-03-14 09:56:01       46 阅读
  8. C语言下使用SQL语言

    2024-03-14 09:56:01       38 阅读
  9. 探索大语言模型(LLM):部分数据集介绍

    2024-03-14 09:56:01       46 阅读
  10. 同程旅行前端面试汇总

    2024-03-14 09:56:01       41 阅读
  11. 数据结构导航 -- 38篇

    2024-03-14 09:56:01       35 阅读
  12. gen_arrow_contour_xld

    2024-03-14 09:56:01       42 阅读
  13. wayland(xdg_wm_base) + egl + opengles 光照模型实例(十五)

    2024-03-14 09:56:01       48 阅读