您的位置:首页 > 数据库 > MySQL

mysql主从同步操作

2012-01-19 10:32 267 查看
首先说下同步原理: Replication 线程    Mysql的 Replication 是一个异步的复制过程,从一个 Mysql instace(我们称之为 Master)复制到另一个 Mysql instance(我们称之 Slave)。在 Master 与 Slave 之间的实现整个复制过程主要由三个线程来完成,其中两个线程(Sql线程和IO线程)在 Slave 端,另外一个线程(IO线程)在 Master 端。   要实现 MySQL 的 Replication ,首先必须打开 Master 端的Binary Log(mysql-bin.xxxxxx)功能,否则无法实现。因为整个复制过程实际上就是Slave从Master端获取该日志然后再在自己身上完全 顺序的执行日志中所记录的各种操作。打开 MySQL 的 Binary Log 可以通过在启动 MySQL Server 的过程中使用 “—log-bin” 参数选项,或者在 my.cnf 配置文件中的 mysqld 参数组([mysqld]标识后的参数部分)增加 “log-bin” 参数项。   MySQL 复制的基本过程如下:   1. Slave 上面的IO线程连接上 Master,并请求从指定日志文件的指定位置(或者从最开始的日志)之后的日志内容;    2. Master 接收到来自 Slave 的 IO 线程的请求后,通过负责复制的 IO 线程根据请求信息读取指定日志指定位置之后的日志信息,返回给 Slave 端的 IO 线程。返回信息中除了日志所包含的信息之外,还包括本次返回的信息在 Master 端的 Binary Log 文件的名称以及在 Binary Log 中的位置;   3. Slave 的 IO 线程接收到信息后,将接收到的日志内容依次写入到 Slave 端的Relay Log文件(mysql-relay-bin.xxxxxx)的最末端,并将读取到的Master端的bin-log的文件名和位置记录到master- info文件中,以便在下一次读取的时候能够清楚的高速Master“我需要从某个bin-log的哪个位置开始往后的日志内容,请发给我”    4. Slave 的 SQL 线程检测到 Relay Log 中新增加了内容后,会马上解析该 Log 文件中的内容成为在 Master 端真实执行时候的那些可执行的 Query 语句,并在自身执行这些 Query。这样,实际上就是在 Master 端和 Slave 端执行了同样的 Query,所以两端的数据是完全一样的。   实际上,在老版本中,MySQL 的复制实现在 Slave 端并不是由 SQL 线程和 IO 线程这两个线程共同协作而完成的,而是由单独的一个线程来完成所有的工作。但是 MySQL 的工程师们很快发现,这样做存在很大的风险和性能问题,主要如下:    首先,如果通过一个单一的线程来独立实现这个工作的话,就使复制 Master 端的,Binary Log日志,以及解析这些日志,然后再在自身执行的这个过程成为一个串行的过程,性能自然会受到较大的限制,这种架构下的 Replication 的延迟自然就比较长了。    其次,Slave 端的这个复制线程从 Master 端获取 Binary Log 过来之后,需要接着解析这些内容,还原成 Master 端所执行的原始 Query,然后在自身执行。在这个过程中,Master端很可能又已经产生了大量的变化并生成了大量的 Binary Log 信息。如果在这个阶段 Master 端的存储系统出现了无法修复的故障,那么在这个阶段所产生的所有变更都将永远的丢失,无法再找回来。这种潜在风险在Slave 端压力比较大的时候尤其突出,因为如果 Slave 压力比较大,解析日志以及应用这些日志所花费的时间自然就会更长一些,可能丢失的数据也就会更多。    所以,在后期的改造中,新版本的 MySQL 为了尽量减小这个风险,并提高复制的性能,将 Slave 端的复制改为两个线程来完成,也就是前面所提到的 SQL 线程和 IO 线程。最早提出这个改进方案的是Yahoo!的一位工程师“Jeremy Zawodny”。通过这样的改造,这样既在很大程度上解决了性能问题,缩短了异步的延时时间,同时也减少了潜在的数据丢失量。   当然,即使是换成了现在这样两个线程来协作处理之后,同样也还是存在 Slave 数据延时以及数据丢失的可能性的,毕竟这个复制是异步的。只要数据的更改不是在一个事务中,这些问题都是存在的。   如果要完全避免这些问题,就只能用 MySQL 的 Cluster 来解决了。不过 MySQL的 Cluster 知道笔者写这部分内容的时候,仍然还是一个内存数 据库的解决方案,也就是需要将所有数据包括索引全部都 Load 到内存中,这样就对内存的要求就非常大的大,对于一般的大众化应用来说可实施性并不是太大。当然,在之前与 MySQL 的 CTO David 交流的时候得知,MySQL 现在正在不断改进其 Cluster 的实现,其中非常大的一个改动就是允许数据不用全部 Load 到内存中,而仅仅只是索引全部 Load 到内存中,我想信在完成该项改造之后的 MySQL Cluster 将会更加受人欢迎,可实施性也会更大。
一、测试环境:
主库(Master):Centos 5.5 64位操作系统
Mysql Server version: 5.1.59
IP:192.168.1.188
从库(Slave):Centos 5.5 64位操作系统
Mysql Server version: 5.1.59
IP:192.168.1.189

权限管理:GRANT privileges ON db TO user@host IDENTIFIED BY "password" WITH GRANT OPTION
Privileges==alter 、select、create、 delect、 drop 、index、 insert 、replication slave 等
常见问题:Slave_IO_Running: No
1.先检查防火墙设置(测试前最好关闭)
2.所有操作完后,注意要重启mysql服务

二、主库的操作
#vi /etc/my.cnf
server-id = 1
my.cnf内容比较多,这里只介绍一些重要参数
server-id = 1 这是数据库ID,此ID唯一,主库用默认的1即可,从库调整为2,多个从库的ID依次类推,切不可有相同ID出现,这样会造成同步出错。

log-bin=mysql-bin 二进制日志文件,此项必须启用,从库需要通过它进行数据同步。
配置主库其实就检查这2个选项,如果你同步的数据库不是全部的,只是同步个别库,或个别的不需要同步,需要继续往下看
binlog-do-db=test 需要同步的数据库,如果同步多个库,需要另行重写,如
binlog-do-db=test1
binlog-do-db=test2
(数据库安装包不同这个选项有的配置文件里没有,需要加上)
binlog-ignore-db=mysql 不需要同步的数据库,与binlog-do-db正好相反,如果你有100个库,只想同步其中几个,那么你应该使用binlog-do-db,如果不想同步其中的几个,就使用binlog-ignore-db
(数据库安装包不同这个选项有的配置文件里没有,需要加上)

建立同步用的数据库账户
主库必须提供一个账户让从库通过此账户进行连接并进行同步,进入mysql后输入下面命令
mysql> grant replication slave on *.* to syncuser@192.168.1.189 identified by '123456';
锁住主库表,停止数据更新
Mysql> flush tables with read lock;
打开另一个shell窗口
Shell> cd /var/lib/
Shell> tar -zcvf mysqlbak.tar.gz mysql
(另外一种打包数据库的方法: Shell> mysqldump --opt --default-character-set=utf8 --master-data --databases castlot warlog assist > castlot120116.sql
Shell>vim castlot120116.sql 查看File和Position并记录)
Mysql>show master status;
+------------------+----------+--------------+------------------+
| File | Position | Binlog_Do_DB | Binlog_Ignore_DB |
+------------------+----------+--------------+------------------+
| mysql-bin.000073 | 98 | | |
+------------------+----------+--------------+------------------+
1 row in set (0.00 sec)
Mysql> unlock tables;

将mysqlbak.tar.gz拷贝到丛库数据库目录下并解压
Shell>scp mysqlbak.tar.gz root@192.168.1.189:/usr/local/

三、从库的操作
Shell>cd /usr/local
Shell>tar -zxvf mysqlbak.tar.gz
(另一种对应方法:Shell>mysql -S /tmp/mysql.sock --default-character-set=utf8 < castlot120116.sql)
将丛库my.cnf中server-id=1修改为server-id=2
增加要同步的数据库:
replicate-wild-do-table=assist.%
replicate-wild-do-table=castlot.%
replicate-wild-do-table=warlog.%
重启下mysql
之前先stop slave
设置连接MASTER MASTER_LOG_FILE为主库的File:mysql-bin.000073,MASTER_LOG_POS为主库的Position:98
mysql> change master to
master_host='192.168.1.188',
master_user='syncuser',
master_password='123456',
master_log_file='mysql-bin.000073',
master_log_pos=98;
Mysql> start slave;

检查从库是否正常同步
mysql>show slave status \G;
*************************** 1. row ***************************
Slave_IO_State: Waiting for master to send event
Master_Host: 192.168.1.188
Master_User: syncuser
Master_Port: 3306
Connect_Retry: 60
Master_Log_File: mysql-bin.000073
Read_Master_Log_Pos: 98
Relay_Log_File: TMac-relay-bin.000073
Relay_Log_Pos: 12753
Relay_Master_Log_File: mysql-bin.000073
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Replicate_Do_DB:
Replicate_Ignore_DB:
Replicate_Do_Table:
Replicate_Ignore_Table:
Replicate_Wild_Do_Table:
Replicate_Wild_Ignore_Table:
Last_Errno: 0
Last_Error:
Skip_Counter: 0
Exec_Master_Log_Pos: 20705416
Relay_Log_Space: 1146541
Until_Condition: None
Until_Log_File:
Until_Log_Pos: 0
Master_SSL_Allowed: No
Master_SSL_CA_File:
Master_SSL_CA_Path:
Master_SSL_Cert:
Master_SSL_Cipher:
Master_SSL_Key:
Seconds_Behind_Master: 0
Master_SSL_Verify_Server_Cert: No
Last_IO_Errno: 0
Last_IO_Error:
Last_SQL_Errno: 0
Last_SQL_Error:
1 row in set (0.00 sec)
ERROR:
No query specified
当Slave_IO_Running 和 Slave_SQL_Running 两列的值都为 "Yes",表明 Slave 的 I/O 和 SQL 线程都在正常运行,如果出现错误,可以从Last_Error这个参数中看出哪里出错,然后进行排查。
进入主库
mysql> use test;
mysql> create table user(id int); //创建测试用表
mysql> insert into user values(12);

进入从库
mysql> use test;
mysql> select * from user;
#如果能查到记录说明同步成功
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  it 同步