Kafka为什么能高效读写数据

1)Kafka 本身是分布式集群,可以采用分区技术,并行度高(生产消费方并行度高);

2)读数据采用稀疏索引,可以快速定位要消费的数据;

3)顺序写磁盘;

        Kafka 的 producer 生产数据,要写入到 log 文件中,写的过程是一直追加到文件末端, 为顺序写。官网有数据表明,同样的磁盘,顺序写能到 600M/s,而随机写只有 100K/s。这与磁盘的机械机构有关,顺序写之所以快,是因为其省去了大量磁头寻址的时间。

       又有如下两个优势: 

        零拷贝:Kafka的数据加工处理操作交由Kafka生产者和Kafka消费者处理。Kafka Broker应用层不关心存储的数据,所以就不用 走应用层,传输效率高。

        PageCache页缓存:Kafka重度依赖底层操作系统提供的PageCache功 能。当上层有写操作时,操作系统只是将数据写入 PageCache。当读操作发生时,先从PageCache中查找,如果找不到,再去磁盘中读取。实际上PageCache是把尽可能多的空闲内存 都当做了磁盘缓存来使用。

相关推荐

  1. kafka为什么不支持分离?

    2023-12-21 21:34:03       50 阅读
  2. python kafka

    2023-12-21 21:34:03       49 阅读
  3. 在Python中Kafka队列

    2023-12-21 21:34:03       44 阅读
  4. python-文本数据

    2023-12-21 21:34:03       34 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-21 21:34:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-21 21:34:03       100 阅读
  3. 在Django里面运行非项目文件

    2023-12-21 21:34:03       82 阅读
  4. Python语言-面向对象

    2023-12-21 21:34:03       91 阅读

热门阅读

  1. Vue框架

    2023-12-21 21:34:03       57 阅读
  2. 软件开发流程

    2023-12-21 21:34:03       50 阅读
  3. 动态规划:理解并掌握算法的艺术

    2023-12-21 21:34:03       55 阅读
  4. docker安装的php 在cli中使用

    2023-12-21 21:34:03       55 阅读
  5. uniapp整合websocket(简易版)

    2023-12-21 21:34:03       53 阅读
  6. python selenium 爬虫教程

    2023-12-21 21:34:03       64 阅读
  7. 启山智软丨机器学习的基础内容

    2023-12-21 21:34:03       70 阅读
  8. 项目架构演进过程

    2023-12-21 21:34:03       64 阅读
  9. 位运算:Leetcode371.两整数之和

    2023-12-21 21:34:03       53 阅读
  10. CCF编程能力等级认证GESP—C++4级—20230611

    2023-12-21 21:34:03       82 阅读
  11. Atcoder ABC179

    2023-12-21 21:34:03       53 阅读