Kafka为什么能高效读写数据

2023-12-21 21:34:03
开发
64

1）Kafka 本身是分布式集群，可以采用分区技术，并行度高（生产消费方并行度高）；

2）读数据采用稀疏索引，可以快速定位要消费的数据；

3）顺序写磁盘；

Kafka 的 producer 生产数据，要写入到 log 文件中，写的过程是一直追加到文件末端，为顺序写。官网有数据表明，同样的磁盘，顺序写能到 600M/s，而随机写只有 100K/s。这与磁盘的机械机构有关，顺序写之所以快，是因为其省去了大量磁头寻址的时间。

又有如下两个优势：

零拷贝：Kafka的数据加工处理操作交由Kafka生产者和Kafka消费者处理。Kafka Broker应用层不关心存储的数据，所以就不用走应用层，传输效率高。

PageCache页缓存：Kafka重度依赖底层操作系统提供的PageCache功能。当上层有写操作时，操作系统只是将数据写入 PageCache。当读操作发生时，先从PageCache中查找，如果找不到，再去磁盘中读取。实际上PageCache是把尽可能多的空闲内存都当做了磁盘缓存来使用。

原文地址:https://blog.csdn.net/zmx_messi/article/details/135094049 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1737828777767079936.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

Kafka为什么能高效读写数据

2023-12-21 21:34:03 65 阅读
kafka为什么不支持读写分离？

2023-12-21 21:34:03 50 阅读
kafka学习笔记-- 文件清理策略与高效读写数据

2023-12-21 21:34:03 59 阅读
python 读写kafka

2023-12-21 21:34:03 49 阅读
VTK读写数据

2023-12-21 21:34:03 50 阅读
大数据处理，Pandas与SQL高效读写大型数据集

2023-12-21 21:34:03 62 阅读
在Python中读写Kafka队列

2023-12-21 21:34:03 44 阅读
SparkSQL扩展——数据读写

2023-12-21 21:34:03 46 阅读
python-读写文本数据

2023-12-21 21:34:03 34 阅读
HDFS 读写数据流程

2023-12-21 21:34:03 26 阅读

最近更新

题解 - 序列

2023-12-21 21:34:03 116 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2023-12-21 21:34:03 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2023-12-21 21:34:03 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2023-12-21 21:34:03 100 阅读
NoSQL之Redis非关系型数据库

2023-12-21 21:34:03 101 阅读
2024.7.22 作业

2023-12-21 21:34:03 97 阅读
GDB调试正在运行的程序

2023-12-21 21:34:03 81 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2023-12-21 21:34:03 85 阅读
在Django里面运行非项目文件

2023-12-21 21:34:03 82 阅读
SSD基本架构与工作原理

2023-12-21 21:34:03 87 阅读
在誉天学习完HCIE就业吗？

2023-12-21 21:34:03 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2023-12-21 21:34:03 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2023-12-21 21:34:03 85 阅读
go 协程池的实现

2023-12-21 21:34:03 88 阅读
Shell脚本循环语句与函数

2023-12-21 21:34:03 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2023-12-21 21:34:03 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2023-12-21 21:34:03 85 阅读
四大引用——强软弱虚

2023-12-21 21:34:03 86 阅读
Python语言-面向对象

2023-12-21 21:34:03 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2023-12-21 21:34:03 85 阅读
网站安全-CDN篇

2023-12-21 21:34:03 88 阅读

热门阅读

C++的泛型编程—模板

2023-12-21 21:34:03 42 阅读
Vue框架

2023-12-21 21:34:03 57 阅读
VR全景技术在政务服务中有哪些应用，为政务服务带来什么便利

2023-12-21 21:34:03 62 阅读
软件开发流程

2023-12-21 21:34:03 50 阅读
动态规划：理解并掌握算法的艺术

2023-12-21 21:34:03 55 阅读
通讯录应用程序开发指南

2023-12-21 21:34:03 43 阅读
微搭低代码密码加密存储

2023-12-21 21:34:03 55 阅读
NLP入门- 分布语义学（Distributional Semantics）

2023-12-21 21:34:03 50 阅读
docker安装的php 在cli中使用

2023-12-21 21:34:03 55 阅读
【2023年网络安全优秀创新成果大赛专刊】银行数据安全解决方案（天空卫士）

2023-12-21 21:34:03 51 阅读
TikTok获客工具开发必不可少的功能!

2023-12-21 21:34:03 49 阅读
[SWPUCTF 2021 新生赛]Do_you_know_http已

2023-12-21 21:34:03 53 阅读
宝塔 FRP 映射插件

2023-12-21 21:34:03 63 阅读
喜报频传小匠物联荣获2023物联网应用示范项目奖

2023-12-21 21:34:03 58 阅读
第二十二章： Spring Boot 集成定时任务（一）

2023-12-21 21:34:03 49 阅读
uniapp整合websocket（简易版）

2023-12-21 21:34:03 53 阅读
python selenium 爬虫教程

2023-12-21 21:34:03 64 阅读
kubeadm方式重置k8s集群

2023-12-21 21:34:03 56 阅读
K8s攻击案例：RBAC配置不当导致集群接管

2023-12-21 21:34:03 61 阅读
K8s攻击案例：Privileged特权容器导致节点沦陷

2023-12-21 21:34:03 60 阅读
系列十四（面试）、谈谈你对StackOverflowError的理解？

2023-12-21 21:34:03 52 阅读
启山智软丨机器学习的基础内容

2023-12-21 21:34:03 70 阅读
项目架构演进过程

2023-12-21 21:34:03 64 阅读
linux 多路径multipath的安装

2023-12-21 21:34:03 56 阅读
位运算：Leetcode371.两整数之和

2023-12-21 21:34:03 53 阅读
Qt前端技术：2.QSS

2023-12-21 21:34:03 57 阅读
AI语音电话机器人识别技术声音合成声音是怎么实现的

2023-12-21 21:34:03 52 阅读
CCF编程能力等级认证GESP—C++4级—20230611

2023-12-21 21:34:03 82 阅读
Atcoder ABC179

2023-12-21 21:34:03 53 阅读
手把手教你美化个人在线网盘_个人网盘搭建学习

2023-12-21 21:34:03 63 阅读