【金三银四】怎么用Redis分布式锁才能确保万无一失

### Kafka的多副本冗余设计不管是传统的基于关系型数据库设计的系统，还是分布式的如`zookeeper`、`redis`、`Kafka`、`HDFS`等等，实现高可用的办法通常是采用冗余设计，通过冗余来解决节点宕机不可用问题。首先简单了解Kafka的几个概念： * **物理模型** ![](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099202842132.jpg) * **逻辑模型** ![](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099202541258.jpg) * **broker**（节点）：Kafka服务节点，简单来说一个`broker`就是一台Kafka服务器，一个物理节点。 * **Topic**（主题）：在Kafka中消息以主题为单位进行归类，每个主题都有一个`Topic Name`，生产者根据Topic Name将消息发送到特定的Topic，消费者则同样根据Topic Name从对应的Topic进行消费。 * **Partition**（分区）：`Topic`（主题）是消息归类的一个单位，但每一个主题还能再细分为一个或多个`Partition`（分区），一个分区只能属于一个主题。主题和分区都是逻辑上的概念，举个例子，消息1和消息2都发送到主题1，它们可能进入同一个分区也可能进入不同的分区（所以同一个主题下的不同分区包含的消息是不同的），之后便会发送到分区对应的broker节点上。 * **Offset**（偏移量）：分区可以看作是一个只进不出的队列（Kafka只保证一个分区内的消息是有序的），消息会往这个队列的尾部追加，每个消息进入分区后都会有一个偏移量，标识该消息在该分区中的位置，消费者要消费该消息就是通过偏移量来识别。其实，根据上述的几个概念，是不是也多少猜到了Kafka的多副本冗余设计实现了？别急，咱继续往下看。在Kafka 0.8版本以前，是没有多副本冗余机制的，一旦一个节点挂掉，那么这个节点上的所有`Partition`的数据就无法再被消费。这就等于发送到Topic的有一部分数据丢失了。在0.8版本后引入副本记者则很好地解决宕机后数据丢失的问题。副本是以`Topic`中每个`Partition`的数据为单位，每个Partition的数据会同步到其他物理节点上，形成多个副本。每个`Partition`的副本都包括一个`leader`副本和多个`Follower`副本，leader由所有的副本共同选举得出，其他副本则都为Follower副本。在生产者写或者消费者读的时候，都只会与leader打交道，在写入数据后Follower就会来拉取数据进行数据同步。 ![](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099203193111.jpg) 就这么简单？是的，基于上面这张多副本架构图就实现了Kafka的高可用。当某个`broker`挂掉了，甭担心，这个`broker`上的`Partition`在其他`broker`节点上还有副本。你说如果挂掉的是`leader`怎么办？那就在`Follower`中在选举出一个`leader`即可，生产者和消费者又可以和新的`leader`愉快地玩耍了，这就是高可用。你可能还有疑问，那要多少个副本才算够用？Follower和leader之间没有完全同步怎么办？一个节点宕机后leader的选举规则是什么？直接抛结论: **多少个副本才算够用？** 副本肯定越多越能保证Kafka的高可用，但越多的副本意味着网络、磁盘资源的消耗更多，性能会有所下降，通常来说副本数为3即可保证高可用，极端情况下将`replication-factor`参数调大即可。 **Follower和Lead之间没有完全同步怎么办？** Follower和leader之间并不是完全同步，但也不是完全异步，而是采用一种`ISR`机制（`In-Sync Replica`）。每个leader会动态维护一个ISR列表，该列表里存储的是和leader基本同步的Follower。如果有Follower由于网络、GC等原因而没有向leader发起拉取数据请求，此时Follower相对于leader是不同步的，则会被踢出ISR列表。所以说，ISR列表中的Follower都是跟得上leader的副本。 **一个节点宕机后leader的选举规则是什么？** 分布式相关的选举规则有很多，像Zookeeper的`Zab`、`Raft`、`Viewstamped Replication`、微软的`PacificA`等。而Kafka的leader选举思路很简单，基于我们上述提到的`ISR`列表，当宕机后会从所有副本中顺序查找，如果查找到的副本在ISR列表中，则当选为leader。另外还要保证前任leader已经是退位状态了，否则会出现脑裂情况（有两个leader）。怎么保证？Kafka通过设置了一个controller来保证只有一个 leader。 ### Ack参数决定了可靠程度另外，这里补充一个面试考Kafka高可用必备知识点：`request.required.asks`参数。 Asks这个参数是生产者客户端的重要配置，发送消息的时候就可设置这个参数。该参数有三个值可配置：**0、1、All**。 **第一种是设为0**，意思是生产者把消息发送出去之后，之后这消息是死是活咱就不管了，有那么点发后即忘的意思，说出去的话就不负责了。不负责自然这消息就有可能丢失，那就把可用性也丢失了。 **第二种是设为1**，意思是生产者把消息发送出去之后，这消息只要顺利传达给了leader，其他Follower有没有同步就无所谓了。存在一种情况，leader刚收到了消息，Follower还没来得及同步broker就宕机了，但生产者已经认为消息发送成功了，那么此时消息就丢失了。注意，**设为1是Kafka的默认配置**！！！可见Kafka的默认配置也不是那么高可用，而是对高可用和高吞吐量做了权衡折中。 **第三种是设为All（或者-1）**，意思是生产者把消息发送出去之后，不仅leader要接收到，ISR列表中的Follower也要同步到，生产者才会任务消息发送成功。进一步思考，`Asks=All`就不会出现丢失消息的情况吗？答案是否。当ISR列表只剩leader的情况下，`Asks=All`相当于`Asks=1`，这种情况下如果节点宕机了，还能保证数据不丢失吗？因此只有在`Asks=All`并且有ISR中有两个副本的情况下才能保证数据不丢失。 ### 解决问题绕了一大圈，了解了Kafka的高可用机制，终于回到我们一开始的问题本身，`Kafka`的一个节点宕机后为什么不可用？我在开发测试环境配置的`broker`节点数是3，`Topic`是副本数为3，`Partition`数为6，`Asks`参数为1。当三个节点中某个节点宕机后，集群首先会怎么做？没错，正如我们上面所说的，集群发现有Partition的leader失效了，这个时候就要从ISR列表中重新选举leader。如果ISR列表为空是不是就不可用了？并不会，而是从Partition存活的副本中选择一个作为leader，不过这就有潜在的数据丢失的隐患了。所以，只要将Topic副本个数设置为和broker个数一样，Kafka的多副本冗余设计是可以保证高可用的，不会出现一宕机就不可用的情况（不过需要注意的是Kafka有一个保护策略，当一半以上的节点不可用时Kafka就会停止）。那仔细一想，Kafka上是不是有副本个数为1的Topic？问题出在了`__consumer_offset`上，`__consumer_offset`是一个Kafka自动创建的`Topic`，用来存储消费者消费的`offset`（偏移量）信息，默认`Partition`数为50。而就是这个Topic，它的默认副本数为1。如果所有的`Partition`都存在于同一台机器上，那就是很明显的单点故障了！当将存储`__consumer_offset`的Partition的broker给Kill后，会发现所有的消费者都停止消费了。这个问题怎么解决？ **第一点**，需要将`__consumer_offset`删除，注意这个Topic时Kafka内置的Topic，无法用命令删除，我是通过将`logs`删了来实现删除。 **第二点**，需要通过设置`offsets.topic.replication.factor`为3来将`__consumer_offset`的副本数改为3。通过将`__consumer_offset`也做副本冗余后来解决某个节点宕机后消费者的消费问题。最后，关于为什么`__consumer_offset`的Partition会出现只存储在一个 broker上而不是分布在各个broker上感到困惑，如果有朋友了解的烦请指教~ # 给大家分享下我的复习的面试资料 > 这些面试全部出自大厂面试真题和面试合集当中，小编已经为大家整理完毕（PDF版） > > **资料获取方式：[戳这里前往我的腾讯文档免费下载](https://docs.qq.com/doc/DSmxTbFJ1cmN1R2dB)** * **第一部分：Java基础-中级-高级** ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099203506826.jpg) * **第二部分：开源框架（SSM：Spring+SpringMVC+MyBatis）** ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099203768057.jpg) * **第三部分：性能调优（JVM+MysqL+Tomcat）** ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099203456291.jpg) * **第四部分：分布式（限流：ZK+Nginx；缓存：Redis+MongoDB+Memcached；通讯：MQ+kafka）** ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099204821406.jpg) * **第五部分：微服务（SpringBoot+SpringCloud+dubbo）** ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099204119672.jpg) * **第六部分：其他：并发编程+设计模式+数据结构与算法+网络** ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099204204789.jpg) # 进阶学习笔记pdf >都已整理好，需免费[下载点击这里即可](https://docs.qq.com/doc/DSmxTbFJ1cmN1R2dB) > >* **Java架构进阶之架构筑基篇（**Java基础+并发编程+JVM+MysqL+Tomcat+网络+数据结构与算法**）** ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099204703910.jpg) * **Java架构进阶之开源框架篇（**设计模式+Spring+SpringMVC+MyBatis**）** ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099204842735.jpg) ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099205628599.jpg) ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099205944622.jpg) * **Java架构进阶之分布式架构篇（**限流（ZK/Nginx）+缓存（Redis/MongoDB/Memcached）+通讯（MQ/kafka）**）** ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099205529707.jpg) ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099205643746.jpg) ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099206658463.jpg) * **Java架构进阶之微服务架构篇（RPC+SpringBoot+SpringCloud+dubbo+K8s）** ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099206304459.jpg) ![image](http://www.icode9.com/i/li/?n=2&i=images/20210701/1625099206718079.jpg)

【金三银四】怎么用Redis分布式锁才能确保万无一失

相关推荐