flink学习-容错机制

checkpoint(检查点)

在flink中最重要的容错机制,就是checkpoint机制,使用checkpoint可以将之前某个时间点的所有的状态进行保存,这个存档就是checkpoint。

检查点的保存

周期性存储保存,间隔时间可以由用户进行指定。
保存时间点应该是整体处理完某一条数据处理完,将这个时间点的状态保存下来。

检查点恢复状态

当发生故障时,需要找到最近一次成功保存的检查点进行数据恢复。

检查点算法

在flink中,采用Channdy-Lamport 算法的分布式快照,可以在不暂停流处理的前提下,经状态备份保存到检查点。
借鉴水位线设计,插入一个特殊数据结构,表示触发检查保存的时间点,算子遇到后就对当前算子内状态进行持久化保存。
在JobManager中有个『检查点协查器』,用以专门协调处理检查点的相关工作。
分布式快照算法
barrier对齐的精准一次
barrier对齐的至少一次
非barrier对齐的精准一次

checkpoint 常用配置

主要是在设置检查点时需要设置周期,已经模式(例如采用精准一次)
超时时间(默认10分钟)
指定检查存储路径
最大checkpoint并发数
最小等待时间间隔
最小等待间隔(上一轮checkpoint结束到下一轮checkpoint开始间的间隔)
取消作业时,checkpoint的数据是否保留在外部系统
允许checkpoint连续失败的次数
非对齐检查点设置后将会自动设置为精准一次。

相关推荐

  1. flink学习-容错机制

    2024-06-16 18:02:02       7 阅读
  2. Flink容错机制

    2024-06-16 18:02:02       29 阅读
  3. Flink容错机制

    2024-06-16 18:02:02       15 阅读
  4. Flink容错机制

    2024-06-16 18:02:02       14 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-16 18:02:02       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-16 18:02:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-16 18:02:02       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-16 18:02:02       20 阅读

热门阅读

  1. netty-reacter写一个http服务器

    2024-06-16 18:02:02       8 阅读
  2. Spring多数据源管理方案

    2024-06-16 18:02:02       8 阅读
  3. Web前端行距代码:深入探索与实战应用

    2024-06-16 18:02:02       10 阅读
  4. 介绍一个 SpringBoot 集成各种场景的项目

    2024-06-16 18:02:02       9 阅读
  5. 外包公司泛滥,这些常识你应该提前知道?

    2024-06-16 18:02:02       6 阅读
  6. 学习分享-FutureTask

    2024-06-16 18:02:02       6 阅读
  7. 基于深度学习的物体材质预测

    2024-06-16 18:02:02       7 阅读
  8. iOS cell的复用以及自定义cell

    2024-06-16 18:02:02       10 阅读
  9. lwip中server和client的socket、地址和端口号

    2024-06-16 18:02:02       10 阅读