AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

Kafka优势

时间：2022-10-13分类：Kafka作者：编程之家原文地址

Kafka优势

kafka通常以集群的方式运行，实现高可用
topic(主题)：在逻辑上对reorder(记录、日志)进行分组保存

kafka的分区

为了实现数据的高可用，比如将分区0的数据分散到不同的kafka节点，每一个分区都有一个 broker作为leader和一个 broker作为Follower

kafka的高性能实现

顺序读写

kafka的数据是保存在磁盘上以实现数据的持久化（缓存，默认168小时），但是kafka的特性依然是高吞吐率，通常情况下数据写入磁盘是会降低写入性能和读取性能的，但是kafka却基于数据的顺序写入技术，就算在普通的服务器上也很容易实现百万级的写入请求，其性能超过了大部分消息中间件，这种较强的写入性能使得kafka在大数据场景得到广泛的应用

MMAP

机械磁盘的每次读写都会产生磁盘寻址--》数据写入的过程，而且寻址是一个"机械动作"，其性能较低耗时较大，所以机械磁盘的随机IO性能较差，但是信息IO性能会有较大改善，为了优化写入性或者其他对象映射到进程的地址空间（虚拟内存），实现文件磁盘地址和进程虚拟地址空间中的一段虚拟地址的一一映射，MMAP可以显著提高I/O性能，尤其对于大文件的性能提升非常显著，用户对内存的所有操作都会由系统内核保存到磁盘上进行数据持久化

零copy

kafka服务器在响应客户端读取的时候，底层使用zerocopy技术，不需要将数据从内核内存空间拷贝至用户进程空间，而且直接将数据通过内核空间构建响应请求，因此并没有执行数据从内核空间copy到进程空间的操作，从而节省copy数据的时间大幅提升性能

kafka总结

顺序写入
MMAP
零copy
基于分区实现横向性能扩容(可动态扩容)

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

kafka分区分配策略

# 前言现有主流消息中间件都是生产者-消费者模型，主要角色都是：Producer -> Broker -> Consumer，上手起来非常简单，但仍有需要知识点需要我们关注，才能避免一些错误的使用情况，或者使用起来更加...

作者：jtea 时间：2024-09-24

Kafka报错：Exception in thread “main“ joptsimple.UnrecognizedOptionException: zookeeper is not a recogn

错误的根源是：kafka版本过高所致，2.2+=的版本，已经不需要依赖zookeeper来创建/查看topic，新版本使用--bootstrap-server替换老版本的--zookeeper-server，即可解决。

作者：血煞长虹时间：2022-12-20

湖仓一体电商项目十九：业务实现之编写写入DWS层业务代码

DWS层主要是存放大宽表数据，此业务中主要是针对Kafka topic “KAFKA-DWD-BROWSE-LOG-TOPIC”中用户浏览商品日志数据关联HBase中“ODS_PRODUCT_CATEGORY”商品分类表与“ODS_PRODUCT_INFO”商品表维度数据获取浏览商...

作者：Lansonli 时间：2022-12-19

Springboot 配置使用 Kafka

不多BB讲原理，只教你怎么用，看了全网没有比我更详细的了，yml 配置，Config 工厂代码配置都有，batch-size、acks、offset、auto-commit、trusted-packages、poll-timeout、linger 应有尽有，批量消费、开启事务、定...

作者：繁华尽头满是殇时间：2022-12-19

【Kafka从成神到升仙系列五】面试官问我 Kafka 生产者的网络架构，我直接开始从源码背起.......

终于写完了，其实最开始学kafka的时候是今年2月份，那时候还不懂什么是IO，看源码的通信基本看不懂后来，花了几个月的时间学了操作系统 --> 计算机网络 --> Linux 通信 --> Java NIO --> Netty，现在看K...

作者：爱敲代码的小黄时间：2022-12-19

Greenplum GPKafka【实践 01】使用GPKafka实现Kafka数据导入Greenplum数据库踩坑问题记录不断更新ing

使用GPKafka实现Kafka数据导入Greenplum数据库踩坑问题记录（不断更新ing）

作者：シ風箏时间：2022-12-19

uni-app 超详细教程一从菜鸟到大佬

uniapp 超详细教程（从菜鸟到大佬）

作者：邢帥兵_ 时间：2022-12-06

Flink最全面教程(自己总结的)

用了100+天总结出来的Flink学习笔记

作者：Moleft 时间：2022-12-06

通过java方式使用Kafka

基于Java API方式使用Kafka

作者：李大寶时间：2022-12-06

【Kafka从成神到升仙系列四】你真的了解 Kafka 的缓存池机制嘛

本章我们讲述了Kafka生产端为了避免频繁的GC，创建了缓存池的机制当生产端申请的内存为16KB时，从缓存池中取缓存使用，非16KB则取不可复用的ByteBuffer使用我们在生产中要尽量避免不可复用的ByteBuffer的产生，根据当...

作者：爱敲代码的小黄时间：2022-11-25