微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

MySQL 5.7多源复制实践

MysqL 5.7多源复制实践》要点:
本文介绍了MysqL 5.7多源复制实践,希望对您有用。如果有疑问,可以联系我们。

MysqL 5.7发布后,在复制方面有了很大的改进和提升.比如开始支持多源复制 (multi-source) 以及真正的支持多线程复制了.多源复制可以使用基于二进制日志的复制或者基于事务的复制.下面我们讲讲如何配置基于二进制日志的多源复制.

什么是多源复制

首先,我们需要清楚几种常见的复制模式:

1)一主一从
2)一主多从
3)级联复制
4)multi-master

MysqL 5.7 之前只能实现一主一从、一主多从或者多主多从的复制.如果想实现多主一从的复制,只能使用 MariaDB,但是 MariaDB 又与官方的 MysqL 版本不兼容.

MysqL 5.7 开始支持了多主一从的复制方式,也就是多源复制.MysqL 5.7 版本相比之前的版本,无论在功能还是性能、安全等方面都已经有不少的提升.

首先,我们需要清楚 multi-mastermulti-source 复制不是一样的.multi-master 复制通常是环形复制,你可以在任意主机上将数据复制给其他主机.

MySQL

multi-source 是不同的.简单的说,多源复制就是将多个主库同步到一个从库上面,从而增加从的利用率,节省了机器.如下图:

多源复制

多源复制使用场景

  • 数据分析部门会需要各个业务部门的部分数据做数据分析,这个时候就可以用到多源复制把各个主数据库的数据复制到统一的数据库中.
  • 在从服务器进行数据汇总,如果我们的主服务器进行了分库分表的操作,为了实现后期的一些数据统计功能,往往需要把数据汇总在一起再统计.
  • 在从服务器对所有主服务器的数据进行备份,在MysqL 5.7之前每一个主服务器都需要一个从服务器,这样很容易造成资源浪费,同时也加大了DBA的维护成本,但MysqL 5.7引入多源复制,可以把多个主服务器的数据同步到一个从服务器进行备份.

使用多源复制的必要条件

不管是使用基于二进制日志的复制或者基于事务的复制,要开启多源复制功能必须需要在从库上设置 master-info-repositoryrelay-log-info-repository 这两个参数.

这两个参数是用来存储同步信息的,可以设置的值为 FILETABLE,认值是 FILE.比如 master-info 就保存在 master.info 文件中,relay-log-info 保存在 relay-log.info文件中,如果服务器意外关闭,正确的 relay-log-info 没有来得及更新到 relay-log.info文件,这样会造成数据丢失.

为了数据更加安全,通常设为 TABLE.这些表都是 innodb 类型的,支持事务.相对文件存储安全得多.在 MysqL 库下可以看见这两个表信息,分别是 MysqL.slave_master_infoMysqL.slave_relay_log_info.

这两个参数也是可以动态调整的.

SET GLOBAL master_info_repository = 'TABLE';
SET GLOBAL relay_log_info_repository = 'TABLE';

如果要启用 enhanced multi-threaded slave(多线程复制),可以设置以下参数

slave-parallel-type=LOGICAL_CLOCK
slave-parallel-workers=8
relay_log_recovery=ON

如果SLAVE已经为开启状态,那么需要首先关闭SLAVE(STOP SLAVE;).

配置多源复制

环境准备

这里一共使用了三台机器,MysqL版本都为5.7.18.

MySQL

安装MysqL

MysqL安装比较简单,官方都有提供不同系统的相应软件源.这里以 Ubuntu 16.04 系统为例:

  • MysqL官方网站下载APT源
$ wget https://dev.MysqL.com/get/MysqL-apt-config_0.8.6-1_all.deb

更多软件源可参考:http://dev.MysqL.com/downloads/repo/apt/,如果是 CentOS/RHEL 系统可参考官方文档:https://dev.MysqL.com/doc/refman/5.7/en/linux-installation-yum-repo.html

  • 安装MysqL软件源并更新
$ dpkg -i MysqL-apt-config_0.8.6-1_all.deb
$ apt-get update
$ apt-get install MysqL-server MysqL-client
$ service MysqL start
  • 检查MysqL Server是否成功启动
$ service MysqL status
● MysqL.service - MysqL Community Server
   Loaded: loaded (/lib/systemd/system/MysqL.service; enabled; vendor preset: enabled)
   Active: active (running) since Mon 2017-06-12 17:16:09 CST; 32s ago
  Process: 10442 ExecStart=/usr/sbin/MysqLd --daemonize --pid-file=/var/run/MysqLd/MysqLd.pid (code=exited,status=0/SUCCESS)
  Process: 10399 ExecStartPre=/usr/share/MysqL/MysqL-systemd-start pre (code=exited,status=0/SUCCESS)
 Main PID: 10446 (MysqLd)
    Tasks: 27
   Memory: 190.8M
      cpu: 362ms
   CGroup: /system.slice/MysqL.service
           └─10446 /usr/sbin/MysqLd --daemonize --pid-file=/var/run/MysqLd/MysqLd.pid

配置MysqL多源复制

配置 MysqL 多源复制,主要是需要在 MysqL 从服务器的主配置文件 [MysqLd] 段中添加以下两行:

$ vim /etc/MysqL/MysqL.conf.d/MysqLd.cnf

master-info-repository = table
relay-log-info-repository = table

MysqL主服务器配置片断

dev-master-01 为例,另一台 Master 也是类似的配置方法.

$ vim /etc/MysqL/MysqL.conf.d/MysqLd.cnf

server-id = 1
log-bin = /var/log/MysqL/MysqL-bin
log_bin_index = /var/log/MysqL/MysqL-bin.index
expire_logs_days = 30
max_binlog_size  = 100M
binlog_format = ROW

MysqL从服务器配置片断

$ vim /etc/MysqL/MysqL.conf.d/MysqLd.cnf

server-id = 3
log-slave-updates = true
skip-slave-start = true
expire_logs_days = 30
max_binlog_size  = 100M
log-bin = /var/log/MysqL/MysqL-bin
relay-log = /var/log/MysqL/relay-log
relay-log-index = /var/log/MysqL/relay-log-index
relay-log-info-file = /var/log/MysqL/relay-log.info
master-info-repository = table
relay-log-info-repository = table
report-port = 3306
report-host = 192.168.2.212
replicate-do-db = master1
replicate-do-db = master2
replicate_wild_do_table=master1.%
replicate_wild_do_table=master2.%

注:server-id 每台必须配置为不一样,比如 dev-master-01 为1,dev-node-01 为2,dev-node-02 为3.这里没有给出全部配置,其它请根据实际情况自行配置.

$ service MysqL restart
  • 创建具有复制权限的用户

在两台 MysqL Master 上创建

MysqL> grant replication slave on *.* to 'repl'@'192.168.2.%' identified by '000000';
MysqL> flush privileges;
  • 从库分别连接至两个主库

MysqL 5.7 有了通信渠道的概念,每一个通信渠道都是一个从服务器到主服务器获得二进制日志的链接.这意味着每个通信渠道都得有一个 IO_THREAD.对于每一个主服务器,我们需要运行不同的 CHANGE MASTER 命令和FOR CHANNEL 这个参数来分别提供不同通信链接名字.

下面开始设置需要同步的源,同步两个主服务器的数据到从服务器上.

设置同步源到 Master1 (在 MysqL 从服务器上执行)

MysqL> CHANGE MASTER TO MASTER_HOST='192.168.2.210',MASTER_USER='repl',MASTER_PORT=3306,MASTER_PASSWORD='000000',MASTER_LOG_FILE='MysqL-bin.000001',MASTER_LOG_POS=1 FOR CHANNEL 'master1';

设置同步源到 Master2 (在 MysqL 从服务器上执行)

MysqL> CHANGE MASTER TO MASTER_HOST='192.168.2.211',MASTER_LOG_POS=1 FOR CHANNEL 'master2';

启动所有SLAVE

MysqL> START SLAVE;

也可以单独启动需要同步的通道.

MysqL> START SLAVE FOR CHANNEL 'master1';
MysqL> START SLAVE FOR CHANNEL 'master2';

停止和 RESET 复制的命令也同 START 类似,可以操作所有的,也可以操作单个通道.

查看SLAVE信息

MysqL> SHOW SLAVE STATUS\G

...
Slave_IO_Running: Yes
Slave_sql_Running: Yes
...

确认 Slave_IO_RunningSlave_sql_Running 两个参数都为 Yes 状态.

如果要查看单一信道的复制的详细状态,可以使用以下命令:

MysqL> SHOW SLAVE STATUS FOR CHANNEL 'master1'\G;

测试多源复制

  • 在主库(dev-master-01)实例创建一些数据.
MysqL> create database master1;
MysqL> use master1;
MysqL> CREATE TABLE `test1` (`id` int(11) DEFAULT NULL,`count` int(11) DEFAULT NULL);
MysqL> insert into test1 values(1,1);
  • 在主库(dev-node-01)实例创建一些数据.
MysqL> create database master2;
MysqL> use master2;
MysqL> CREATE TABLE `test2` (`id` int(11) DEFAULT NULL,`count` int(11) DEFAULT NULL);
MysqL> insert into test2 values(1,1);
  • 在从库(dev-node-02)实例检查数据是否成功复制.
MysqL> select * from master1.test1;
+------+-------+
| id   | count |
+------+-------+
|    1 |     1 |
+------+-------+
1 row in set (0.00 sec)

MysqL> select * from master2.test2;
+------+-------+
| id   | count |
+------+-------+
|    1 |     1 |
+------+-------+
1 row in set (0.00 sec)
  • 查看复制管理视图

列出所有的复制信道的复制状态概况:

MySQL 5.7多源复制实践

performance_schema 库中,提供了复制相关的一些视图,可供查看复制相关的信息.

MysqL> use performance_schema;
MysqL> show tables like '%repl%';
+-------------------------------------------+
| Tables_in_performance_schema (%repl%)     |
+-------------------------------------------+
| replication_applier_configuration         |
| replication_applier_status                |
| replication_applier_status_by_coordinator |
| replication_applier_status_by_worker      |
| replication_connection_configuration      |
| replication_connection_status             |
| replication_group_member_stats            |
| replication_group_members                 |
+-------------------------------------------+
8 rows in set (0.00 sec)

这些表里分别有多源通道的配置信息和多源通道的状态信息,另外还有连接配置信息和连接状态信息,如果配置了多线程复制的话,还会有多线程配置信息和多线程状态信息.

其它一些需要注意的点

  • 初次配置耗时较长,需要将各个 master 的数据 dump 下来,再 source 到 slave 上.
  • 需要考虑各 master 数据增长频率,slave 的数据增长频率是这些数据的总和.如果太高,会导致大量的磁盘IO,造成数据更新延迟,最严重的是会影响正常的查询.
  • 如果多个主数据库实例中存在同名的库,则同名库的表都会放到一个库中;
  • 如果同名库中的表名相同且结构相同,则数据会到一起;如果结构不同,则先建的有效.

文章来源微信公众号:运维之美

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐