### 异步复制
**
MysqL的复制
默认是异步的**,主从复制至少需要两个
MysqL服务,这些
MysqL服务可以分布在不同的服务器上,也可以在同一台服务器上。
MysqL主从异步复制是最常见的复制场景。数据的完整性依赖于主库
binlog的不丢失,只要主库的
binlog不丢失,那么就算主库宕机了,我们还可以通过
binlog把丢失的部分数据通过手工同步到从库上去。
**注意**:主库宕机的情况下,DBA可以通过
MysqLbinlog工具手工访问主库
binlog,抽取缺失的日志并同步到从库上去;也可以通过配置高可用MHA架构来
自动抽取缺失的数据补全从库,或者启用Global Transaction Identifiers(GTID)来
自动抽取缺失
binlog到从库。
MysqL在
binlog中记录事务(或
sql语句),也就是说对于
支持事务的的引擎(例如InnoDB)来说,每个事务提交时都需要写
binlog;对于
不支持事务的引擎(例如MyISAM)来说,每个
sql语句执行完成时,都需要些
binlog。为了保证
binlog的安全,
MysqL引入sync_
binlog参数来控制
binlog刷新到磁盘的频率。
```
show variables like 'sync_
binlog';
```

* 在
默认情况下,sync_
binlog=1,表示事务提交之前,
MysqL都需要先把
binlog刷新到磁盘,这样的话,即使出现
数据库主机操作系统崩溃或者主机突然掉电的情况,系统最多损失prepared状态的事务;设置sync_
binlog=1,尽可能保证数据安全。
* sync_
binlog=0,表示
MysqL不控制
binlog的刷新,由
文件系统自己控制
文件缓存的刷新。
* sync_
binlog=N,如果N不等于0或者1,刷新方式同sync_
binlog=1类似,只不过此时会延长刷新频率至N次
binlog提交组之后。
以上是传统的异步复制,在
MysqL5.7的并行复制技术(也称多线程复制)到来之前,为人诟病最多的还是效率问题,slave延迟是
一个顽疾,虽然之前已经出现了schema级别的并行复制,但实际
效果并不好。
### 多线程复制
在
MysqL5.7中,带来了全新的**多线程复制**技术,
解决了当master同
一个schema下的数据发生了变更,从库不能并发应用的问题,同时也真正将
binlog组提交的优势充分发挥出来,保障了从库并发应用Relay Log的能力。
在
MysqL8.0中,多线程复制又进行了技术更新,引入了writeset的概念,而在之前的版本中,如果主库的同
一个会话顺序执行多个不同相关对象的事务,例如,先执行了Update A表的数据,又执行了Update B表的数据,那么
binlog在复制到从库后,这两个事务是不能并行执行的,writeset的到来,突破了这个限制。
### 增强半同步复制
前面介绍的复制是异步操作,主库和从库的数据之间难免会存在一定的延迟,这样存在
一个隐患:当在主库上写入
一个事务并提交成功,而从库尚未得到主库的
binlog日志时,主库由于磁盘损坏、内存故障、断电等原因意外宕机,导致主库上该事务
binlog丢失,此时从库就会损失这个事务,从而造成主从不一致。
为了
解决这个问题,从
MysqL5.5开始,引入了半同步复制,此时的技术暂且称之为传统的半同步复制,因该技术发展到
MysqL5.7后,已经演变为增强半同步复制(也成为无损复制)。在异步复制时,主库执行Commit提交操作并写入
binlog日志后即可成功返回客户端,无需等待
binlog日志传送给从库,如图所示。

而半同步复制时,为了保证主库上的每
一个binlog事务都能够被可靠地复制到从库上,主库在每次事务成功提交时,并不及时反馈给前端应用
用户,而是等待至少
一个从库(详见参数rpl_semi_sync_master_wait_for_slave_count)也接收到
binlog事务并成功写入中继日志后,主库才返回Commit操作成功给客户端(不管是传统的半同步复制,还是增强的半同步复制,目的都是一样的,只不过两种方式有
一个席位地方不同,将在下面说明)
半同步复制保证了事务成功提交后,至少有两份日志记录,一份在主库的
binlog日志上,另一份在至少
一个从库的中继日志Relay Log上,从而更进一步保证了数据的完整性。
在传统的半同步复制中,主库写数据到
binlog,且执行Commit操作后,会一直等待从库的ACK,即从库写入Relay Log后,并将数据落盘,返回给主库消息,
通知主库可以返回前端应用操作成功,这样会出现
一个问题,就是实际上主库已经将该事务Commit到了事务引擎层,应用已经可以可以看到数据发生了变化,只是在等待返回而已,如果此时主库宕机,有可能从库还没能写入Relay Log,就会发生主从库不一致。增强半同步复制就是为了
解决这个问题,做了微调,即主库写数据到
binlog后,就开始等待从库的应答ACK,直到至少
一个从库写入Relay Log后,并将数据落盘,然后返回给主库消息,
通知主库可以执行Commit操作,然后主库开始提交到事务引擎层,应用此时可以看到数据发生了变化。增强半同步复制的大致流程如下图所示。

半同步复制模式下,假如在传送
binlog日志到从库时,从库宕机或者网络延迟,导致
binlog并没有即使地传送到从库上,此时主库上的事务会等待一段时间(时间长短由参数rpl_semi_sync_master_timeout设置的毫秒数决定),如果
binlog在这段时间内都无法成功发送到从库上,则
MysqL自动调整复制为异步模式,事务正常返回提交结果给客户端。
半同步复制很大程度上取决于主从库之
间的网络情况,往返时延RTT越小决定了从库的实时性越好。通俗地说,主从库之
间的网络越快,从库约实时。
**注意**:往返时延RTT(Round-Trip Time)在计算机网络中是
一个重要的
性能指标,它表示从发送端发送数据开始到发送端接收到接收端的确认,总共经历的时长(这里可能有点拗口,我们可以理解为TCP三次握手的前两次握手)。
### 最后
小编精心为大家准备了一手资料


**[点击这里免费领取](https://docs.qq.com/doc/DSmxTbFJ1cmN1R2dB)**以上Java高级架构资料、源码、笔记、视频。
dubbo、Re
dis、设计模式、Netty、zookeeper、Spring cloud、分布式、高并发等架构技术
【附】架构书籍赠送
1. BAT面试的20道高频
数据库问题解析
2. Java面试宝典
3. Netty实战
4. 算法

**BATJ面试要点及Java架构师进阶资料**

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。