ElasticSearch之分片相关概念segment,merge,refresh等

写在前面

本文看下分片相关概念,segment,merge,refresh等。

1:segment,commit point,.del

一个倒排索引的文件称为segment,多个segment组合在一起就是lucene的index,也就是es的shard。在lucene中有一个文件叫做commit point,用来记录所有segment的信息。删除的数据并不会真正删除,而是记录在.del文件,参考下图:
在这里插入图片描述

2:refresh,transaction log

写入文档时并不会直接写入到segment中,而是同时会写入到index buffer(内存)和transaction log(磁盘,数据不丢失)中,然后index buffer中的数据,默认每隔1秒(refresh.index_interval配置)刷新到segment中,这个操作叫refresh,但不执行fsync,refresh后数据就可以被搜索到了(这也是为什么es被称为近实时搜索系统)。具体参考下图们:

  • 1
    在这里插入图片描述
  • 2
    在这里插入图片描述

3:flush

强制落盘操作,index buffer会写入segment,并会fsync,transaction log也会清空,默认30分钟执行一次,具体如下图:
在这里插入图片描述

4:merge

将多个segment合并为1个的操作,如下:
在这里插入图片描述

写在后面

参考文章列表

相关推荐

  1. WEB渗透相关概念(笔记)

    2024-03-10 04:32:03       25 阅读
  2. 学习分享-微服务的相关概念

    2024-03-10 04:32:03       29 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-10 04:32:03       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-10 04:32:03       106 阅读
  3. 在Django里面运行非项目文件

    2024-03-10 04:32:03       87 阅读
  4. Python语言-面向对象

    2024-03-10 04:32:03       96 阅读

热门阅读

  1. Django常用命令

    2024-03-10 04:32:03       43 阅读
  2. Lwip之TCP客户端示例记录

    2024-03-10 04:32:03       42 阅读
  3. PTA天梯 L2-009 抢红包

    2024-03-10 04:32:03       41 阅读
  4. Elasticsearch:dense vector 数据类型及标量量化

    2024-03-10 04:32:03       41 阅读
  5. flutter 获取屏幕尺寸

    2024-03-10 04:32:03       40 阅读
  6. SpringCloud-使用Feign组件调用其他微服务的接口

    2024-03-10 04:32:03       50 阅读
  7. linux系统部署Elasticsearch集群

    2024-03-10 04:32:03       49 阅读
  8. Jenkins快速了解

    2024-03-10 04:32:03       47 阅读
  9. SQL语句

    SQL语句

    2024-03-10 04:32:03      37 阅读
  10. MySQL产生死锁的根本原因及解决方法

    2024-03-10 04:32:03       38 阅读
  11. 【深度学习笔记】6_1 语言模型lang-model

    2024-03-10 04:32:03       50 阅读
  12. Prompts(二)

    2024-03-10 04:32:03       49 阅读