ElasticSearch之通过update_by_query和_reindex重建索引

写在前面

当我们索引的mapping,setting发生变更时,我们需要重建索引来使得这些变更生效。es提供了两种方式来完成重建索引的操作:

1:update by query,在本索引重建
2:reindex,在新索引上重建

我们通过具体实例来分别看下。

1:增加子字段

核心点,如果不执行update_by_query,修改mapping前将会无法查询到。执行update_by_query的方式如下:

POST {索引名称}/_update_by_query
{
  
}

具体实例(从上往下看即可):

# 1:创建索引,指定mapping
DELETE blogs

PUT blogs
{
  "mappings": {
    "properties": {
      "content": {
        "type": "text"
      },
      "keyword": {
        "type": "text"
      }
    }
  }
}

# 2:修改mapping前插入一条数据
PUT blogs/_doc/1
{
  "content": "Hadoop is coll",
  "keyword": "Hadoop"
}

# 3:修改mapping,增加子字段english
PUT blogs/_mapping
{
  "properties": {
    "content": {
      "type": "text",
      "fields": {
        "english": {
          "type": "text",
          "analyzer": "english"
        }
      }
    },
    "keyword": {
      "type": "text"
    }
  }
}

# 4:修改mapping后插入一条记录
PUT blogs/_doc/2
{
  "content": "Elasticsearch is hard to study,but i will keep up",
  "keyword": "Elasticsearch"
}

# 5:查询修改mapping前的数据,查询不到
POST blogs/_search
{
  "query": {
    "match": {
      "content.english": "Hadoop"
    }
  }
}

# 6:查询修改mapping后的数据,可以查询到
POST blogs/_search
{
  "query": {
    "match": {
      "content.english": "Elasticsearch"
    }
  }
}

# 7:执行update_by_query,重建本索引
POST blogs/_update_by_query
{
  
}

# 8:再次查询修改mapping前的数据,就可以查询到了
POST blogs/_search
{
  "query": {
    "match": {
      "content.english": "Hadoop"
    }
  }
}

2:修改字段类型

es不允许修改字段类型,想要完成修改字段类型操作的话必须使用reindex。

# 1:创建索引,指定mapping,注意此时keyword字段是text类型
DELETE blogs

PUT blogs
{
  "mappings": {
    "properties": {
      "content": {
        "type": "text"
      },
      "keyword": {
        "type": "text"
      }
    }
  }
}

# 2:插入几条测试数据
POST blogs/_bulk
{"index": {"_id": 1}}
{"content":"Hadoop is coll","keyword":"Hadoop"}
{"index": {"_id": 2}}
{"content":"Elasticsearch is hard to study,but i will keep up","keyword":"Elasticsearch"}

# 3:尝试修改keyword的数据类型从text为keyword,会报错
# mapper [keyword] of different type, current_type [text], merged_type [keyword]
PUT blogs/_mapping
{
  "properties": {
    "content": {
      "type": "text"
    },
    "keyword": {
      "type": "keyword"
    }
  }
}

# 4:创建全新的索引,但是指定keyword字段类型为keyword
DELETE blogs_fix

PUT blogs_fix
{
  "mappings": {
    "properties": {
      "content": {
        "type": "text"
      },
      "keyword": {
        "type": "keyword"
      }
    }
  }
}

# 5:通过reindex拷贝数据到新索引
POST _reindex
{
  "source": {
    "index": "blogs"
  },
  "dest": {
    "index": "blogs_fix"
  }
}

# 6:看是否成功 "count" : 2即为成功了
GET blogs_fix/_count

# 7:对keyword字段执行term agg,可以成功,进一步验证其字段类型是keyword(因为textfielddata默认是关闭的无法term)
GET blogs_fix/_search
{
  "aggs": {
    "term分组验证就是keyword类型": {
      "terms": {
        "field": "keyword"
      }
    }
  }
}

3:其他知识点

3.1:reindex需要注意的点

在这里插入图片描述
第二点需要注意,提前设置好mapping和setting,要不然可能会做无用功。

3.2:op_type

如果是目标index已经存在部分文档,为了忽略已存在的文档,可增加该参数:
在这里插入图片描述

3.3:跨集群reindex

在这里插入图片描述

3.4:异步reindex

通过增加wait_for_completion=false,使用异步方式来复制索引,可通过GET _tasks?detailed=true&actions=*reindex来查看任务执行情况:
在这里插入图片描述

写在后面

参考文章列表

ElasticSearch之聚合aggs

相关推荐

  1. Elasticsearch_reindex

    2024-03-16 08:40:02       57 阅读
  2. Elasticsearch重建索引-修改索引字段类型

    2024-03-16 08:40:02       63 阅读
  3. Elasticsearch reindex用管道转换类型

    2024-03-16 08:40:02       30 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-16 08:40:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-16 08:40:02       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-16 08:40:02       82 阅读
  4. Python语言-面向对象

    2024-03-16 08:40:02       91 阅读

热门阅读

  1. Level 2 行情数据存储处理

    2024-03-16 08:40:02       44 阅读
  2. CRC校验(FPGA实现)

    2024-03-16 08:40:02       44 阅读
  3. 【nuget】如何移动 nuget 缓存文件夹

    2024-03-16 08:40:02       36 阅读
  4. Node.js 中的 HTTP 模块教程

    2024-03-16 08:40:02       39 阅读
  5. 个人商城系统开源(注册)

    2024-03-16 08:40:02       36 阅读
  6. 嵌入式学习day38 HTML

    2024-03-16 08:40:02       37 阅读
  7. 【Android】源码中的工厂方法模式

    2024-03-16 08:40:02       39 阅读
  8. Kafka主题二三事

    2024-03-16 08:40:02       39 阅读
  9. 【 React 】在React 项目是如何捕获错误的?

    2024-03-16 08:40:02       46 阅读