【架构-8】Lambda和Kappa架构

Lambda架构?

Lambda架构(三层架构):
(1)将数据处理分为实时和离线两部分。离线部分通过批量计算处理数据,实时部分则通过增加追加方式将数据合并到批处理中。
(2)批处理和增量处理独立存在,适合处理大数据量的场景。
(3)适用于离线批处理和增量处理场景,如离线数据分析、报表生成等。
在这里插入图片描述
在这里插入图片描述

批处理层:存储数据集。
【MapReduce】【Spark】
加速层:处理最近的增量数据流。
【Spark Streaming】【Storm】
服务层:合并批视图和实时视图中的结果数据集到最终数据集。
【Redis】【MySQL】【HBase】【Hive】

优点:(1)容错性好(2)灵活度高(3)易伸缩易扩展
缺点:(1)全场景覆盖带来的编码开销(2)重新部署和迁移成本高

应用实例
在这里插入图片描述

Kappa架构?

Kappa架构(二层架构):
(1)以流处理为主的数据分析架构,实时层流式处理输入数据,生成实时视图,服务层接受用户请求,查询实时视图,响应用户请求。
(2)流式处理,适合处理实时数据。
(3)适用于实时性要求高的场景,如金融、物流等领域的实时监控、预警等。
在这里插入图片描述
实时层:处理输入数据,生成实时视图。
【采用Apache Kafka回访数据】
【采用Flink或Spark Streaming处理】

服务层:使用实时视图中的结果数据集响应用户请求。
【一般使用数据仓库或数据湖中的缓存或存储作为服务层】
在这里插入图片描述

优点:离线和实时处理代码统一,将实时和离线统一起来,方便进行数据处理;具有低延迟、高吞吐量、高可扩展性等优点。
缺点:计算能力相对较弱,难以即时响应;过度依赖特定组件(如Redis和HBase)。

应用实例
在这里插入图片描述

Lambda和Kappa架构的区别?

在这里插入图片描述
在这里插入图片描述

相关推荐

  1. 深入解析Lambda架构Kappa架构

    2024-04-11 14:48:04       43 阅读
  2. 「大数据」Kappa架构

    2024-04-11 14:48:04       39 阅读
  3. Kappa架构介绍

    2024-04-11 14:48:04       32 阅读
  4. 数据仓库之Kappa架构

    2024-04-11 14:48:04       31 阅读
  5. 「大数据」Lambda架构

    2024-04-11 14:48:04       36 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-11 14:48:04       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-11 14:48:04       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-11 14:48:04       82 阅读
  4. Python语言-面向对象

    2024-04-11 14:48:04       91 阅读

热门阅读

  1. Docker

    Docker

    2024-04-11 14:48:04      37 阅读
  2. win11安装weblogic12C遇到的奇怪问题

    2024-04-11 14:48:04       39 阅读
  3. 磁盘管理与逻辑卷

    2024-04-11 14:48:04       33 阅读
  4. 蓝桥杯刷题 二分-[364]跳石头(C++)

    2024-04-11 14:48:04       35 阅读
  5. 使用Python快速模拟前端常用页面数据格式

    2024-04-11 14:48:04       38 阅读
  6. 单例模式基本介绍及两种实现方式详解

    2024-04-11 14:48:04       38 阅读