bitscn.com
mysql + php的模式在大并发压力下经常会导致mysql中存在大量僵死进程,导致服务挂死。为了自动干掉这些进程,弄了个脚本,放在服务器后台通过crontab自动执行。发现这样做了以后,的确很好的缓解了这个问题。把这个脚本发出来和大家share.
根据自己的实际需要,做了一些修改:
shell脚本:mysqld_kill_sleep.sh
#!/bin/sh
mysql_pwd=”root的密码
mysqladmin_exec=/usr/local/bin/mysqladmin
mysql_exec=/usr/local/bin/mysql
mysql_timeout_dir=/tmp
mysql_timeout_log=$mysql_timeout_dir/mysql_timeout.log
mysql_kill_timeout_sh=$mysql_timeout_dir/mysql_kill_timeout.sh
mysql_kill_timeout_log=$mysql_timeout_dir/mysql_kill_timeout.log
$mysqladmin_exec -uroot -p$mysql_pwd processlist | awk '{ print $12 , $2 ,$4}' | grep -v time | grep -v '|' | sort -rn > $mysql_timeout_log
awk '{if($1>30 && $3!=root) print '$mysql_exec' -e / kill,$2 / -uroot -p/'$mysql_pwd'/ ; }' $mysql_timeout_log > $mysql_kill_timeout_sh
echo check start .... >> $mysql_kill_timeout_log
echo `date` >> $mysql_kill_timeout_log
cat $mysql_kill_timeout_sh
把这个写到mysqld_kill_sleep.sh。然后chmod 0 mysqld_kill_sleep.sh,chmod u+rx mysqld_kill_sleep.sh,然后用root账户到cron里面运行即可,时间自己调整。
执行之后显示:
www# ./mysqld_kill_sleep.sh
/usr/local/bin/mysql -e kill 27549 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27750 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27840 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27867 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27899 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27901 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27758 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27875 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27697 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27888 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27861 -uroot -pmysql root的密码;
如果确认没有问题了,把最后的cat修改为sh即可。
本人改写了下上面的脚本:
#!/bin/bash
mysql_pwd=密码
mysql_exec=/usr/local/mysql/bin/mysql
mysql_timeout_dir=/tmp
mysql_kill_timeout_sh=$mysql_timeout_dir/mysql_kill_timeout.sh
mysql_kill_timeout_log=$mysql_timeout_dir/mysql_kill_timeout.log
$mysql_exec -uroot -p$mysql_pwd -e show processlist | grep -i locked >> $mysql_kill_timeout_log
chmod 777 $mysql_kill_timeout_log
for line in `$mysql_kill_timeout_log | awk '{print $1}'`
do
echo $mysql_exec -uroot -p$mysql_pwd -e /kill $line/ >> $mysql_kill_timeout_sh
done
chmod 777 $mysql_kill_timeout_sh
cat $mysql_kill_timeout_sh
============================================================================
很多时候!一不小心就锁表!这里讲解决锁表终极方法!
案例一
mysql>show processlist;
参看sql语句
一般少的话
mysql>kill thread_id;
就可以解决了
kill掉第一个锁表的进程, 依然没有改善. 既然不改善, 咱们就想办法将所有锁表的进程kill掉吧, 简单的脚本如下.
#!/bin/bash
mysql - u root - e show processlist | grep - i locked >> locked_log . txt
for line in ` cat locked_log.txt | awk '{print $1 }' `
do
echo kill $line ; >> kill_thread_id . sql
done
现在kill_thread_id.sql的内容像这个样子
kill 66402982 ;
kill 66402983 ;
kill 66402986 ;
kill 66402991 ;
.....
好了, 我们在mysql的shell中执行, 就可以把所有锁表的进程杀死了.
mysql > source kill_thread_id . sql
当然了, 也可以一行搞定
for id in `mysqladmin processlist | grep -i locked | awk '{print $1}'`
do
mysqladmin kill ${id}
done
案例二
如果大批量的操作能够通过一系列的select语句产生,那么理论上就能对这些结果批量处理。
但是mysql并没用提供eval这样的对结果集进行分析操作的功能。所以只能现将select结果保存到临时文件中,然后再执行临时文件中的指令。
具体过程如下:
mysql> select concat('kill ',id,';') from information_schema.processlist where user='root';
+------------------------+
| concat('kill ',id,';')
+------------------------+
| kill 3101;
| kill 2946;
+------------------------+
2 rows in set (0.00 sec)
mysql> select concat('kill ',id,';') from information_schema.processlist where user='root' into outfile '/tmp/a.txt';
query ok, 2 rows affected (0.00 sec)
mysql> source /tmp/a.txt;
query ok, 0 rows affected (0.00 sec)
案例三
mysql + php的模式在大并发压力下经常会导致mysql中存在大量僵死进程,导致服务挂死。为了自动干掉这些进程,弄了个脚本,放在服务器后台通过crontab自动执行。发现这样做了以后,的确很好的缓解了这个问题。把这个脚本发出来和大家share.
根据自己的实际需要,做了一些修改:
shell脚本:mysqld_kill_sleep.sh
#!/bin/sh
mysql_pwd=root的密码
mysqladmin_exec=/usr/local/bin/mysqladmin
mysql_exec=/usr/local/bin/mysql
mysql_timeout_dir=/tmp
mysql_timeout_log=$mysql_timeout_dir/mysql_timeout.log
mysql_kill_timeout_sh=$mysql_timeout_dir/mysql_kill_timeout.sh
mysql_kill_timeout_log=$mysql_timeout_dir/mysql_kill_timeout.log
$mysqladmin_exec -uroot -p$mysql_pwd processlist | awk '{ print $12 , $2 ,$4}' | grep -v time | grep -v '|' | sort -rn > $mysql_timeout_log
awk '{if($1>30 && $3!=root) print '$mysql_exec' -e / kill,$2 / -uroot -p/'$mysql_pwd'/ ; }' $mysql_timeout_log > $mysql_kill_timeout_sh
echo check start .... >> $mysql_kill_timeout_log
echo `date` >> $mysql_kill_timeout_log
cat $mysql_kill_timeout_sh
把这个写到mysqld_kill_sleep.sh。然后chmod 0 mysqld_kill_sleep.sh,chmod u+rx mysqld_kill_sleep.sh,然后用root账户到cron里面运行即可,时间自己调整。
执行之后显示:
www# ./mysqld_kill_sleep.sh
/usr/local/bin/mysql -e kill 27549 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27750 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27840 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27867 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27899 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27901 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27758 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27875 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27697 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27888 -uroot -pmysql root的密码;
/usr/local/bin/mysql -e kill 27861 -uroot -pmysql root的密码;
如果确认没有问题了,把最后的cat修改为sh即可。
本人改写了下上面的脚本:
#!/bin/bash
mysql_pwd=密码
mysql_exec=/usr/local/mysql/bin/mysql
mysql_timeout_dir=/tmp
mysql_kill_timeout_sh=$mysql_timeout_dir/mysql_kill_timeout.sh
mysql_kill_timeout_log=$mysql_timeout_dir/mysql_kill_timeout.log
$mysql_exec -uroot -p$mysql_pwd -e show processlist | grep -i locked >> $mysql_kill_timeout_log
chmod 777 $mysql_kill_timeout_log
for line in `$mysql_kill_timeout_log | awk '{print $1}'`
do
echo $mysql_exec -uroot -p$mysql_pwd -e /kill $line/ >> $mysql_kill_timeout_sh
done
chmod 777 $mysql_kill_timeout_sh
cat $mysql_kill_timeout_sh
是不是很方便呢!
=============================================================
processlist命令的输出结果显示了有哪些线程在运行,可以帮助识别出有问题的查询语句,两种方式使用这个命令。
1. 进入mysql/bin目录下输入mysqladmin processlist;
2. 启动mysql,输入show processlist;
如果有super权限,则可以看到全部的线程,否则,只能看到自己发起的线程(这是指,当前对应的mysql帐户运行的线程)。
得到数据形式如下(只截取了三条):
mysql> show processlist;
+-----+-------------+--------------------+-------+---------+-------+----------------------------------+----------
| id | user | host | db | command | time| state | info
+-----+-------------+--------------------+-------+---------+-------+----------------------------------+----------
|207|root |192.168.0.20:51718 |mytest | sleep | 5 | | null
|208|root |192.168.0.20:51719 |mytest | sleep | 5 | | null
|220|root |192.168.0.20:51731 |mytest |query | 84 | locked |
select bookname,culture,value,type from book where id=001
先简单说一下各列的含义和用途,第一列,id,不用说了吧,一个标识,你要kill一个语句的时候很有用。user列,显示单前用户,如果不是root,这个命令就只显示你权限范围内的sql语句。host列,显示这个语句是从哪个ip的哪个端口上发出的。呵呵,可以用来追踪出问题语句的用户。db列,显示这个进程目前连接的是哪个数据库。command列,显示当前连接的执行的命令,一般就是休眠(sleep),查询(query),连接(connect)。time列,此这个状态持续的时间,单位是秒。state列,显示使用当前连接的sql语句的状态,很重要的列,后续会有所有的状态的描述,请注意,state只是语句执行中的某一个状态,一个sql语句,已查询为例,可能需要经过copying to tmp table,sorting result,sending data等状态才可以完成,info列,显示这个sql语句,因为长度有限,所以长的sql语句就显示不全,但是一个判断问题语句的重要依据。
这个命令中最关键的就是state列,mysql列出的状态主要有以下几种:
checking table
正在检查数据表(这是自动的)。
closing tables
正在将表中修改的数据刷新到磁盘中,同时正在关闭已经用完的表。这是一个很快的操作,如果不是这样的话,就应该确认磁盘空间是否已经满了或者磁盘是否正处于重负中。
connect out
复制从服务器正在连接主服务器。
copying to tmp table on disk
由于临时结果集大于tmp_table_size,正在将临时表从内存存储转为磁盘存储以此节省内存。
creating tmp table
正在创建临时表以存放部分查询结果。
deleting from main table
服务器正在执行多表删除中的第一部分,刚删除第一个表。
deleting from reference tables
服务器正在执行多表删除中的第二部分,正在删除其他表的记录。
flushing tables
正在执行flush tables,等待其他线程关闭数据表。
killed
发送了一个kill请求给某线程,那么这个线程将会检查kill标志位,同时会放弃下一个kill请求。mysql会在每次的主循环中检查kill标志位,不过有些情况下该线程可能会过一小段才能死掉。如果该线程程被其他线程锁住了,那么kill请求会在锁释放时马上生效。
locked
被其他查询锁住了。
sending data
正在处理select查询的记录,同时正在把结果发送给客户端。
sorting for group
正在为group by做排序。
sorting for order
正在为order by做排序。
opening tables
这个过程应该会很快,除非受到其他因素的干扰。例如,在执alter table或lock table语句行完以前,数据表无法被其他线程打开。正尝试打开一个表。
removing duplicates
正在执行一个select distinct方式的查询,但是mysql无法在前一个阶段优化掉那些重复的记录。因此,mysql需要再次去掉重复的记录,然后再把结果发送给客户端。
reopen table
获得了对一个表的锁,但是必须在表结构修改之后才能获得这个锁。已经释放锁,关闭数据表,正尝试重新打开数据表。
repair by sorting
修复指令正在排序以创建索引。
repair with keycache
修复指令正在利用索引缓存一个一个地创建新索引。它会比repair by sorting慢些。
searching rows for update
正在讲符合条件的记录找出来以备更新。它必须在update要修改相关的记录之前就完成了。
sleeping
正在等待客户端发送新请求.
system lock
正在等待取得一个外部的系统锁。如果当前没有运行多个mysqld服务器同时请求同一个表,那么可以通过增加--skip-external-locking参数来禁止外部系统锁。
upgrading lock
insert delayed正在尝试取得一个锁表以插入新记录。
updating
正在搜索匹配的记录,并且修改它们。
user lock
正在等待get_lock()。
waiting for tables
该线程得到通知,数据表结构已经被修改了,需要重新打开数据表以取得新的结构。然后,为了能的重新打开数据表,必须等到所有其他线程关闭这个表。以下几种情况下会产生这个通知:flush tables tbl_name, alter table, rename table, repair table, analyze table,或optimize table。
waiting for handler insert
insert delayed已经处理完了所有待处理的插入操作,正在等待新的请求。
大部分状态对应很快的操作,只要有一个线程保持同一个状态好几秒钟,那么可能是有问题发生了,需要检查一下。
还有其他的状态没在上面中列出来,不过它们大部分只是在查看服务器是否有存在错误是才用得着。
mysql手册里有所有状态的说明,链接如下:http://dev.mysql.com/doc/refman/5.0/en/general-thread-states.html
bitscn.com