【51cto独家特稿】web开发者不光要解决程序的效率问题,对数据库的快速访问和相应也是一个大问题。希望本文能对大家掌握mysql优化技巧有所帮助。 1.优化你的mysql查询缓存 在mysql服务器上进行查询,可以启用高速查询缓存。让数据库引擎在后台悄悄的处理是提
【51cto独家特稿】web开发者不光要解决程序的效率问题,对数据库的快速访问和相应也是一个大问题。希望本文能对大家掌握mysql优化技巧有所帮助。
1.优化你的mysql查询缓存
在mysql服务器上进行查询,可以启用高速查询缓存。让数据库引擎在后台悄悄的处理是提高性能的最有效方法之一。当同一个查询被执行多次时,如果结果是从缓存中提取,那是相当快的。
但主要的问题是,它是那么容易被隐藏起来以至于我们大多数程序员会忽略它。在有些处理任务中,我们实际上是可以阻止查询缓存工作的。
// query cache does not work $r = mysql_query(select username from user where signup_date >= curdate()); // query cache works! $today = date(y-m-d); $r = mysql_query(select username from user where signup_date >= '$today'); // query cache does not work $r = mysql_query(select username from user where signup_date >= curdate()); // query cache works! $today = date(y-m-d); $r = mysql_query(select username from user where signup_date >= '$today');
2.用explain使你的select查询更加清晰
使用explain关键字是另一个mysql优化技巧,可以让你了解mysql正在进行什么样的查询操作,这可以帮助你发现瓶颈的所在,并显示出查询或表结构在哪里出了问题。
explain查询的结果,可以告诉你那些索引正在被引用,表是如何被扫描和排序的等等。
实现一个select查询(最好是比较复杂的一个,带joins方式的),在里面添加上你的关键词解释,在这里我们可以使用phpmyadmin,他会告诉你表中的结果。举例来说,假如当我在执行joins时,正忘记往一个索引中添加列,explain能帮助我找到问题的所在。
添加索引到group_id field后
3.利用limit 1取得唯一行
有时,当你要查询一张表是,你知道自己只需要看一行。你可能会去的一条十分独特的记录,或者只是刚好检查了任何存在的记录数,他们都满足了你的where子句。
在这种情况下,增加一个limit 1会令你的查询更加有效。这样数据库引擎发现只有1后将停止扫描,而不是去扫描整个表或索引。、
// do i have any users from alabama? // what not to do: $r = mysql_query(select * from user where state = 'alabama'); if (mysql_num_rows($r) > 0) { // ... } // much better: $r = mysql_query(select 1 from user where state = 'alabama' limit 1); if (mysql_num_rows($r) > 0) { // ... }
4. 索引中的检索字段
索引不仅是主键或唯一键。如果你想搜索表中的任何列,你应该一直指向索引。
5.保证连接的索引是相同的类型
如果应用程序中包含多个连接查询,你需要确保你链接的列在两边的表上都被索引。这会影响mysql如何优化内部联接操作。
此外,加入的列,必须是同一类型。例如,你加入一个decimal列,而同时加入另一个表中的int列,mysql将无法使用其中至少一个指标。即使字符编码必须同为字符串类型。
// looking for companies in my state $r = mysql_query(select company_name from users left join companies on (users.state = companies.state) where users.id = $user_id); // both state columns should be indexed // and they both should be the same type and character encoding // or mysql might do full table scans
6.不要使用by rand()命令
这是一个令很多新手程序员会掉进去的陷阱。你可能不知不觉中制造了一个可怕的平静。这个陷阱在你是用by rand()命令时就开始创建了。
如果您真的需要随机显示你的结果,有很多更好的途径去实现。诚然这需要写更多的代码,但是能避免性能瓶颈的出现。问题在于,mysql可能会为表中每一个独立的行执行by rand()命令(这会消耗处理器的处理能力),然后给你仅仅返回一行。
// what not to do: $r = mysql_query(select username from user order by rand() limit 1); // much better: $r = mysql_query(select count(*) from user); $d = mysql_fetch_row($r); $rand = mt_rand(0,$d[0] - 1); $r = mysql_query(select username from user limit $rand, 1);
7.尽量避免select *命令
从表中读取越多的数据,查询会变得更慢。他增加了磁盘需要操作的时间,还是在数据库服务器与web服务器是独立分开的情况下。你将会经历非常漫长的网络延迟,仅仅是因为数据不必要的在服务器之间传输。
始终指定你需要的列,这是一个非常良好的习惯。
// not preferred $r = mysql_query(select * from user where user_id = 1); $d = mysql_fetch_assoc($r); echo welcome {$d['username']}; // better: $r = mysql_query(select username from user where user_id = 1); $d = mysql_fetch_assoc($r); echo welcome {$d['username']}; // the differences are more significant with bigger result sets
8.从procedure analyse()中获得建议
procedure analyse()可让mysql的柱结构分析和表中的实际数据来给你一些建议。如果你的表中已经存在实际数据了,能为你的重大决策服务。
9.准备好的语句
准备好的语句,可以从性能优化和安全两方面对大家有所帮助。
准备好的语句在过滤已经绑定的变量默认情况下,能给应用程序以有效的保护,防止sql注入攻击。当然你也可以手动过滤,不过由于大多数程序员健忘的性格,很难达到效果。
// create a prepared statement if ($stmt = $mysqli->prepare(select username from user where state=?)) { // bind parameters $stmt->bind_param(s, $state); // execute $stmt->execute(); // bind result variables $stmt->bind_result($username); // fetch value $stmt->fetch(); printf(%s is from %s\n, $username, $state); $stmt->close(); }
10.将ip地址存储为无符号整型
许多程序员在创建一个varchar(15)时并没有意识到他们可以将ip地址以整数形式来存储。当你有一个int类型时,你只占用4个字节的空间,这是一个固定大小的领域。
你必须确定你所操作的列是一个unsigned int类型的,因为ip地址将使用32位unsigned integer。
$r = update users set ip = inet_aton('{$_server['remote_addr']}') where user_id = $user_id;
2
网络字节转换inet_aton & inet_ntoa & inet_addr和inet_pton & inet_ntopselect inet_ntoa (ip) from web_ip where id=1
select ip from web_ip where id=1
11.是否运用框架
select id from collect order by id limit 90000,10; 很快,0.04秒就ok。 为什么?因为用了id主键做索引当然快。网上的改法是:
select id,title from collect where id>=(select id from collect order by id limit 90000,1) limit 10;
这就是用了id做索引的结果。可是问题复杂那么一点点,就完了。看下面的语句
select id from collect where vtype=1 order by id limit 90000,10; 很慢,用了8-9秒!
对于大型系统,php千万不能用框架,尤其是那种连sql语句都看不到的框架!因为开始对于我的轻量级框架都差点崩 溃!只适合小型应用的快速开发,对于erp,oa,大型网站,数据层包括逻辑层的东西都不能用框架。如果程序员失去了对sql语句的把控,那项目的风险将 会成几何级数增加!尤其是用mysql 的时候,mysql 一定需要专业的dba 才可以发挥他的最佳性能。一个索引所造成的性能差别可能是上千倍!
12.关于索引
hash 索引结构的特殊性,其检索效率非常高,索引的检索可以一次定位,不像b-tree 索引需要从根节点到枝节点,最后才能访问到页节点这样多次的io访问,所以 hash 索引的查询效率要远高于 b-tree 索引。
可 能很多人又有疑问了,既然 hash 索引的效率要比 b-tree 高很多,为什么大家不都用 hash 索引而还要使用 b-tree 索引呢?任何事物都是有两面性的,hash 索引也一样,虽然 hash 索引效率高,但是 hash 索引本身由于其特殊性也带来了很多限制和弊端,主要有以下这些。
(1)hash 索引仅仅能满足=,in和查询,不能使用范围查询。
由于 hash 索引比较的是进行 hash 运算之后的 hash 值,所以它只能用于等值的过滤,不能用于基于范围的过滤,因为经过相应的 hash 算法处理之后的 hash 值的大小关系,并不能保证和hash运算前完全一样。
(2)hash 索引无法被用来避免数据的排序操作。
由于 hash 索引中存放的是经过 hash 计算之后的 hash 值,而且hash值的大小关系并不一定和 hash 运算前的键值完全一样,所以数据库无法利用索引的数据来避免任何排序运算;
(3)hash 索引不能利用部分索引键查询。
对于组合索引,hash 索引在计算 hash 值的时候是组合索引键合并后再一起计算 hash 值,而不是单独计算 hash 值,所以通过组合索引的前面一个或几个索引键进行查询的时候,hash 索引也无法被利用。
(4)hash 索引在任何时候都不能避免表扫描。
前面已经知道,hash 索引是将索引键通过 hash 运算之后,将 hash运算结果的 hash 值和所对应的行指针信息存放于一个 hash 表中,由于不同索引键存在相同 hash 值,所以即使取满足某个 hash 键值的数据的记录条数,也无法从 hash 索引中直接完成查询,还是要通过访问表中的实际数据进行相应的比较,并得到相应的结果。
(5)hash 索引遇到大量hash值相等的情况后性能并不一定就会比b-tree索引高。
对于选择性比较低的索引键,如果创建 hash 索引,那么将会存在大量记录指针信息存于同一个 hash 值相关联。这样要定位某一条记录时就会非常麻烦,会浪费多次表数据的访问,而造成整体性能低下。