Docs/数据库/mysql/主从复制延迟原因及解决方法.md
2022-10-18 16:59:37 +08:00

55 lines
No EOL
6.8 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

### 原因
2)1)、MySQL数据库主从同步延迟原理mysql主从同步原理主库针对写操作顺序写binlog从库单线程去主库顺序读”写操作的binlog”从库取到binlog在本地原样执行随机写来保证主从数据逻辑上一致。mysql的主从复制都是单线程的操作主库对所有DDL和DML产生binlogbinlog是顺序写所以效率很高slave的Slave_IO_Running线程到主库取日志效率比较高下一步问题来了slave的Slave_SQL_Running线程将主库的DDL和DML操作在slave实施。DML和DDL的IO操作是随即的不是顺序的成本高很多还可能slave上的其他查询产生lock争用由于Slave_SQL_Running也是单线程的所以一个DDL卡主了需要执行10分钟那么所有之后的DDL会等待这个DDL执行完才会继续执行这就导致了延时。有朋友会问“主库上那个相同的DDL也需要执行10分为什么slave会延时答案是master可以并发Slave_SQL_Running线程却不可以。
2)、MySQL数据库主从同步延迟是怎么产生的当主库的TPS并发较高时产生的DDL数量超过slave一个sql线程所能承受的范围那么延时就产生了当然还有就是可能与slave的大型query语句产生了锁等待。首要原因数据库在业务上读写压力太大CPU计算负荷大网卡负荷大硬盘随机IO太高次要原因读写binlog带来的性能影响网络传输延迟。
### 方案
1)、架构方面
1.业务的持久化层的实现采用分库架构mysql服务可平行扩展分散压力。
2.单个库读写分离,一主多从,主写从读,分散压力。这样从库压力比主库高,保护主库。
3.服务的基础架构在业务和mysql之间加入memcache或者redis的cache层。降低mysql的读压力。
4.不同业务的mysql物理上放在不同机器分散压力。
5.使用比主库更好的硬件设备作为slave总结mysql压力小延迟自然会变小。
2)、硬件方面
1.采用好服务器比如4u比2u性能明显好2u比1u性能明显好。
2.存储用ssd或者盘阵或者san提升随机写的性能。
3.主从间保证处在同一个交换机下面,并且是万兆环境。
总结,硬件强劲,延迟自然会变小。一句话,缩小延迟的解决方案就是花钱和花时间。
3)、mysql主从同步加速
1、sync_binlog在slave端设置为0
2、logs-slave-updates 从服务器从主服务器接收到的更新不记入它的二进制日志。
3、直接禁用slave端的binlog
4、slave端如果使用的存储引擎是innodbinnodb_flush_log_at_trx_commit =2
4)、从文件系统本身属性角度优化
master端修改linux、Unix文件系统中文件的etime属性 由于每当读文件时OS都会将读取操作发生的时间回写到磁盘上对于读操作频繁的数据库文件来说这是没必要的只会增加磁盘系统的负担影响I/O性能。可以通过设置文件系统的mount属性组织操作系统写atime信息在linux上的操作为打开/etc/fstab加上noatime参数/dev/sdb1 /data reiserfs noatime 1 2然后重新mount文件系统#mount -oremount /data
5)、同步参数调整主库是写对数据安全性较高比如sync_binlog=1innodb_flush_log_at_trx_commit = 1 之类的设置是需要的而slave则不需要这么高的数据安全完全可以讲sync_binlog设置为0或者关闭binloginnodb_flushlog也可以设置为0来提高sql的执行效率
1、sync_binlog=1 oMySQL提供一个sync_binlog参数来控制数据库的binlog刷到磁盘上去。默认sync_binlog=0表示MySQL不控制binlog的刷新由文件系统自己控制它的缓存的刷新。这时候的性能是最好的但是风险也是最大的。一旦系统Crash在binlog_cache中的所有binlog信息都会被丢失。
如果sync_binlog>0表示每sync_binlog次事务提交MySQL调用文件系统的刷新操作将缓存刷下去。最安全的就是sync_binlog=1了表示每次事务提交MySQL都会把binlog刷下去是最安全但是性能损耗最大的设置。这样的话在数据库所在的主机操作系统损坏或者突然掉电的情况下系统才有可能丢失1个事务的数据。但是binlog虽然是顺序IO但是设置sync_binlog=1多个事务同时提交同样很大的影响MySQL和IO性能。虽然可以通过group commit的补丁缓解但是刷新的频率过高对IO的影响也非常大。
对于高并发事务的系统来说“sync_binlog”设置为0和设置为1的系统写入性能差距可能高达5倍甚至更多。所以很多MySQL DBA设置的sync_binlog并不是最安全的1而是2或者是0。这样牺牲一定的一致性可以获得更高的并发和性能。默认情况下并不是每次写入时都将binlog与硬盘同步。因此如果操作系统或机器(不仅仅是MySQL服务器)崩溃有可能binlog中最后的语句丢失了。要想防止这种情况你可以使用sync_binlog全局变量(1是最安全的值但也是最慢的)使binlog在每N次binlog写入后与硬盘同步。即使sync_binlog设置为1,出现崩溃时也有可能表内容和binlog内容之间存在不一致性。
2、innodb_flush_log_at_trx_commit 这个很管用抱怨Innodb比MyISAM慢 100倍那么你大概是忘了调整这个值。默认值1的意思是每一次事务提交或事务外的指令都需要把日志写入flush硬盘这是很费时的。特别是使用电池供电缓存Battery backed up cache时。设成2对于很多运用特别是从MyISAM表转过来的是可以的它的意思是不写入硬盘而是写入系统缓存。日志仍然会每秒flush到硬 盘所以你一般不会丢失超过1-2秒的更新。设成0会更快一点但安全方面比较差即使MySQL挂了也可能会丢失事务的数据。而值2只会在整个操作系统 挂了时才可能丢数据。
3、ls(1) 命令可用来列出文件的 atime、ctime 和 mtime。
atime 文件的access time 在读取文件或者执行文件时更改的ctime 文件的create time 在写入文件更改所有者权限或链接设置时随inode的内容更改而更改mtime 文件的modified time 在写入文件时随文件内容的更改而更改ls -lc filename 列出文件的 ctimels -lu filename 列出文件的 atimels -l filename 列出文件的 mtimestat filename 列出atimemtimectimeatime不一定在访问文件之后被修改因为使用ext3文件系统的时候如果在mount的时候使用了noatime参数那么就不会更新atime信息。这三个time stamp都放在 inode 中.如果mtime,atime 修改,inode 就一定会改, 既然 inode 改了,那ctime也就跟着改了.之所以在 mount option 中使用 noatime, 就是不想file system 做太多的修改, 而改善读取效能