mysql rpl_semi_sync_master_timeout相关的一件bug1.背景 部署基于mysql原生复制的ha系统时,发现在半同步模式下,半同步复制降级为异步复制的超时时间如果设得很长,会严重影响性能高,这是个很奇怪的现象。
2.现象 组合不同参数,用sysbench做压力测试。
sysbench --db-driver=mysql --mysql-db=test2 --mysql-host=srdsdevapp69 --mysql-table-engine=innodb --oltp-table-size=5000000 --num-threads=10 --max-time=10 --max-requests=0 --oltp-test-mode=complex --oltp-read-only=off --test=/opt/sysbench-0.5/sysbench/tests/db/insert.lua run
结果如下:
rpl_semi_sync_master_enabledrpl_semi_sync_master_timeoutqps备注
on 21474836480 13.99 约248天
2147483648 196.3 约24.8天
214748364 1251.67 约2.5天
86400000 2146.96 1天
43200000 3211.17 12小时
21600000 3583.02 6小时
10000 3637.16 10秒(默认值)
off - 8926.76
3. 原因 从上面的表不难看出,当rpl_semi_sync_master_timeout很大时,每个查询的执行时间和rpl_semi_sync_master_timeout成正比。
为什么会出现这么奇葩的事?翻开mysql的代码,立刻真相大白!
plugin\semisync\semisync_master.cc:
#define time_thousand 1000
#define time_million 1000000
#define time_billion 1000000000
...
int replsemisyncmaster::committrx(const char* trx_wait_binlog_name,
my_off_t trx_wait_binlog_pos)
{
...
unsigned long long diff_nsecs =
start_ts.tv_nsec + (unsigned long long)wait_timeout_ * time_million;
abstime.tv_sec = start_ts.tv_sec;
while (diff_nsecs >= time_billion)//这个while循环是罪魁祸首!!!
{
abstime.tv_sec++;
diff_nsecs -= time_billion;
}
abstime.tv_nsec = diff_nsecs;
...
}
上面有个while循环,循环次数等于rpl_semi_sync_master_timeout对应的秒数,也就是说,如果设置成300天的话,要循环25920000次,不慢才怪!
4. 修复把那段代码中的while替换等价的写法后,问题解决。测出的qps在3700左右,和rpl_semi_sync_master_timeout无关。
4.1 修改代码plugin\semisync\semisync_master.cc:
# diff plugin/semisync/semisync_master.cc plugin/semisync/semisync_master.cc_bak
687,688c687,688
---
> start_ts.tv_nsec + (unsigned long long)wait_timeout_ * time_million;
> abstime.tv_sec = start_ts.tv_sec;
4.2 编译cmake -dcmake_install_prefix=/usr/local/mysql -dmysql_datadir=/usr/local/mysql/data -dsysconfdir=/etc -dwith_myisam_storage_engine=1 -dwith_innobase_storage_engine=1 -dwith_memory_storage_engine=1 -dwith_readline=1 -dmysql_unix_addr=/var/lib/mysql/mysql.sock -dmysql_tcp_port=3306 -denabled_local_infile=1 -dwith_partition_storage_engine=1 -dextra_charsets=all -ddefault_charset=utf8 -ddefault_collation=utf8_general_ci -dwith_fast_mutexes=1make
注:上面的编译选项填的比较随意,从网上随便抄了后再改的,只求编译通过。
4.3 拷贝半同步插件chown mysql:mysql ./plugin/semisync/semisync_master.socp -rf ./plugin/semisync/semisync_master.so /usr/local/mysql/lib/mysql/plugin/semisync_master.socp -rf ./plugin/semisync/semisync_master.so /usr/local/mysql/lib/plugin/semisync_master.so
4.4重启mysql5. 补充该bug已报告到mysql官方网站,http://bugs.mysql.com/80651
http://www.bkjia.com/phpjc/1108686.htmlwww.bkjia.comtruehttp://www.bkjia.com/phpjc/1108686.htmltecharticlemysql rpl_semi_sync_master_timeout相关的一件bug 1.背景 部署基于mysql原生复制的ha系统时,发现在半同步模式下,半同步复制降级为异步复制的超时...