分析sqlserver查询计划

最近使用到sqlserver数据库并要对查询语句进行调优，之前接触的不多，搜索网上一些帖子和查阅微软msdn资料对sqlserver的查询计划才大致了解了一些，用这篇文章做个总结。本文主要侧重对查询计划的理解，尤其是对微软复杂的运算函数的理解，如理解有误请指出
最近使用到sqlserver数据库并要对查询语句进行调优，之前接触的不多，搜索网上一些帖子和查阅微软msdn资料对sqlserver的查询计划才大致了解了一些，用这篇文章做个总结。本文主要侧重对查询计划的理解，尤其是对微软复杂的运算函数的理解，如理解有误请指出。如何查看查询计划先介绍一下如何查看查询计划。使用【sql server management studio】进行查询，大致有如下几个方式看查询计划
1、set showplan_all on 在查询前显示计划，显示形式为每个查询步骤一行
2、set statistics profile on 在查询后显示计划，并包括每个查询步骤的扫描行数和执行次数
3、选中sql语句按ctrl + l(同工具栏“显示预估的查询计划”按钮) 以图形方式显示查询计划。这个还可以使用setshowplan_xml on命令，后者生成的xml被【sql server management studio】打开就是图形查询计划
关于查询计划的说明在msdn上找到set showplan_all on返回结果各列的说明
具体查询计划分析初步分析计划开启set showplan_all on
执行如下sql
select dbll.n_szjy gbm, sum(data.n_sl) nnum
from db_share.dbo.da_jgxt_vw_qbf_ffjl data
left join db_share.dbo.t_dbll dbll
on dbll.c_zfbh = data.zfbh and dbll.d_ksrq data.d_rq and (dbll.d_jsrq >= data.d_rq ordbll.d_jsrq is null)
where data.d_rq >= '2012-07-02 00:00:00.0' and data.d_rq '2012-08-01 23:59:59.0'
group by dbll.n_szjy
执行计划左半部分
接上图计划的右半部分如下：
sqlserver的执行计划一出来给人一种特别复杂的感觉有木有，其中命令特别多，还可以看到我们没有写出来的语句比如expr1006，expr1012，bmk1003这都是什么啊？
一步一步来先看看执行计划中每个列的说明
（msdn有对执行计划所有运算符的说明
http://msdn.microsoft.com/zh-cn/library/ms191158(v=sql.105)
）
根据msdn说明，对上面的执行计划分析如下，对于整个计划树的执行是从下到上，从叶子到根的，最上边是整个查询语句：
12、【rid lookup(object:([db_share].[dbo].[t_dbll] as [dbll]), seek:([bmk1003]=[bmk1003]), where:([db_share].[dbo].[t_dbll].[d_jsrq] as [dbll].[d_jsrq]>=[db_share].[dbo].[da_jgxt_vw_qbf_ffjl].[d_rq] as [data].[d_rq] or [db_share].[dbo].[t_dbll].[d_jsrq] as [dbll].[d_jsrq] is null) lookup ordered forward)】
这是一个书签查找步骤，，rid（record id） lookup是使用行标示符在堆上进行书签查找，seek后面有一个[bmk1003]=[bmk1003]，看命名是一个书签，在11行的definedvalues列有对此的定义。
11、【index seek(object:([db_share].[dbo].[t_dbll].[i_dbll_zfbh_ksrq] as [dbll]), seek:([dbll].[c_zfbh]=[db_share].[dbo].[da_jgxt_vw_qbf_ffjl].[zfbh] as [data].[zfbh] and [dbll].[d_ksrq] 】
这是使用i_dbll_zfbh_ksrq索引在t_dbll表检索数据，seek部分是检索的具体条件，此步骤定义了bmk1003，11步应该先于12执行，看来在同一层级下顺序是从上到下的。
11步骤和12步骤的意思是先用i_dbll_zfbh_ksrq索引检索数据，再使用书签查找的方式获取每一行的其他数据。因为i_dbll_zfbh_ksrq是一个非聚集索引，它只包含索引列的数据，实际上对t_dbll检索出的数据列还包括n_szjy和d_jsrq，前者要进行group，后者是进行与da_jgxt_vw_qbf_ffjl的d_rq的比对，查询语句涉及到非聚集索引不包含的列时就要通过书签查找或聚集索引查找来提取非索引列（t_dbll此时没有聚集索引，只能用书签查找的方式）。
10、【nested loops(inner join, outer references:([bmk1003]))】
一次嵌套循环连接，将11和12步骤数据连接起来，11步骤的数据作为outer，在进行书签查找的父步骤一般都是nested loops join，这基本符合内表较大且有索引的条件。
9、【table scan(object:([db_share].[dbo].[da_jgxt_vw_qbf_ffjl] as [data]), where:([db_share].[dbo].[da_jgxt_vw_qbf_ffjl].[d_rq] as [data].[d_rq]>='2012-07-02 00:00:00.000' and [db_share].[dbo].[da_jgxt_vw_qbf_ffjl].[d_rq] as [data].[d_rq]】
在da_jgxt_vw_qbf_ffjl表全表扫描数据，条件是d_rq在一个时间段内。显然这是需要增加索引的
8、【parallelism(repartition streams, roundrobin partitioning)】
这是什么呢？看看微软古板的说明“parallelism 运算符执行分发流、收集流和对流重新分区逻辑操作。argument 列可以包含一个 partition columns:() 谓词和一个以逗号分隔的分区列的列表。argument 列还可以包含一个 order by:() 谓词，以列出分区过程中要保留排序顺序的列。repartition streams 运算符处理多个流并生成多个记录流。记录的内容和格式不会改变”。大约是这样，parallelism表示查询会被并行执行（如果服务器负荷太高可能最终不会并行），这算是sqlserver的一个优化处理，如果服务器处理多任务能力强这就会比串行更有效率，这个并行应该是表示和其他任务的关系，由于10步骤会依赖8步骤的数据，8步骤应该先于10步骤执行
7、【nested loops(left outer join, outer references:([data].[zfbh], [data].[d_rq], [expr1012]) with unordered prefetch)】
一次嵌套循环连接，它将8和10两个步骤得到的数据连接，outer表是da_jgxt_vw_qbf_ffjl，因outer references中的字段都是属于该表。
这里出现了expr1012，这是个神秘的列，联系上下语句，这个列应该是t_dbll的n_szjy，因为后面要用此列数据进行分组。
6、【sort(order by:([dbll].[n_szjy] asc))】
使用n_szjy列排序，后面要进行group，这里必须先进行一次排序
5、【stream aggregate(group by:([dbll].[n_szjy]) define:([partialagg1007]=count_big([db_share].[dbo].[da_jgxt_vw_qbf_ffjl].[n_sl] as [data].[n_sl]), [partialagg1009]=sum([db_share].[dbo].[da_jgxt_vw_qbf_ffjl].[n_sl] as [data].[n_sl])))】
名词解释，“stream aggregate 运算符按一列或多列对行分组，然后计算查询返回的一个或多个聚合表达式。此运算符的输出可供查询中的后续运算符引用和/或返回到客户端。stream aggregate 运算符要求输入在组中按列进行排序。如果由于前面的 sort 运算符或已排序的索引查找或扫描导致数据尚未排序，优化器将在此运算符前面使用一个 sort 运算符”
继续根据微软生硬的解释进行分析，这行的处理就是进行一个分组，因为group by dbll.n_szjy一句而产生此行处理。其中还有一个count_big，这是一个类似count的函数，区别是前者返回bigint后者返回int，不过语句中只有个sum没有count，为什么还要计算呢？跳过先。
4、【parallelism(gather streams, order by:([dbll].[n_szjy] asc))】
又一个并行查询。“gather streams 运算符仅用在并行查询计划中。gather streams 运算符处理几个输入流并通过组合这几个输入流生成单个记录输出流。不更改记录的内容和格式。如果此运算符保留顺序，则所有的输入流都必须有序。如果输出已排序，则参数列包含一个 order by:() 谓词和正在排序的列名称。” gather streams函数把输入流组合，不过4行只有一个子节点，我理解到4之前仍存在两个输入流，分别来自da_jgxt_vw_qbf_ffjl表和t_dbll表，上面的步骤对两个输入流分别有索引条件过滤和分组，但仍然没有整合，在gather streams步骤将两个输入流数据整合起来，那么之后的数据看到的就是一个输入流了
3、【stream aggregate(group by:([dbll].[n_szjy]) define:([globalagg1008]=sum([partialagg1007]), [globalagg1010]=sum([partialagg1009])))】
再次进行流聚合。这里和第5步骤的不同在哪里
第5步骤definedvalues中有如下定义
[partialagg1007]=count_big([db_share].[dbo].[da_jgxt_vw_qbf_ffjl].[n_sl] as [data].[n_sl]), [partialagg1009]=sum([db_share].[dbo].[da_jgxt_vw_qbf_ffjl].[n_sl] as [data].[n_sl])
而此步骤执行了
[globalagg1008]=sum([partialagg1007]), [globalagg1010]=sum([partialagg1009])
这就是它们的不同，此步骤再次用n_szjy分组对之前的计算结果求和，这应该是个避免整合流后分组数据出现重复的操作。
2、【compute scalar(define:([expr1006]=case when [globalagg1008]=(0) then null else [globalagg1010] end))】
compute scalar的意思是计算标量。标量，相对于向量而言，无方向数据，就是计算一个数值。这个步骤sqlserver优化器执行了一个case when，globalagg1008是针对每个n_szjy的count（n_sl），看来之前自动执行count是为了此步，globalagg1010是针对每个n_szjy的sum（n_sl），对照我们的语句是select dbll.n_szjy gbm, sum(data.n_sl) nnum，此步骤的意图看来sqlserver会对sum特殊情况的检测，对于整个语句而言就是如果t_dbll表中n_szjy列有数据而da_jgxt_vw_qbf_ffjl中n_sl都为null，那么sum就返回null
1、【整条语句】。作为查询计划树的根节点，在计划列表中大多数列都是null，这个计划的估算行是12行，仅供参考，实际查询的结果是1行
关于表扫描sql server 会有以下方法来查找您需要的数据记录：
1. 【table scan】：遍历整个表，查找所匹配的记录行。这个操作将会一行一行的检查，当然，效率也是最差的。
2. 【index scan】：根据非聚集索引，扫描索引的全部记录，查找所匹配的记录行，匹配的条件可从查询计划的argument 列中看到。比第一种方式的查找范围要小（b+索引叶子之间有指针类似链表），因此比【table scan】要快。
3. 【index seek】：根据非聚集索引，定位（获取）记录的存放位置，然后取得记录（这会使用b+索引查找树的定位算法，基本一条记录2-4次io，取决于表数据量产生的索引树高度），这个方式比起前二种方式会更快。
4. 【clustered index scan】：根据聚集索引扫描全部记录。这个的效率要根据实际情况分析。出现这个步骤可能是效率很差的表现，因为如果条件中的列没有索引，数据库引擎在提取数据的时会考虑进行优化，基于磁盘顺序读比随机读快的原理，数据按照聚集索引的顺序存放，那么用聚集索引来提取数据是一种对更差方式的优化。
比如da_jgxt_vw_qbf_ffjl表有715455条记录，
如下记录返回8条记录，优化器使用clustered index scan
select * from db_share.dbo.da_jgxt_vw_qbf_ffjl where n_id = 14000
执行时间10s，计划如下，io消耗是7.21多，此时使用聚集索引扫描来顺序提取数据，这个步骤在这里就是避免更差的随机磁盘读取
如下语句返回24条记录, 优化器使用clustered index seek
select * from db_share.dbo.da_jgxt_vw_qbf_ffjl where d_rq = '2012-07-25 00:00:00.0'
执行时间0s毫秒级，计划如下，io消耗是0.000232
而直接使用select top 10 * from db_share.dbo.da_jgxt_vw_qbf_ffjl查询计划也会使用clustered index scan，
select top 10 * from db_share.dbo.da_jgxt_vw_qbf_ffjl
|--top(top expression:((10)))
|--clustered index scan (object:([db_share].[dbo].[da_jgxt_vw_qbf_ffjl].[i_da_jgxt_vw_qbf_ffjl_rq]))
对于这个无条件的语句这个计划已经是最优的了
5. 【clustered index seek】：根据聚集索引获取记录，不解释，最快！
优化table scan使用日期过滤数据，对d_rq建立聚集索引
create clustered index i_da_jgxt_vw_qbf_ffjl_rq on dbo.da_jgxt_vw_qbf_ffjl(d_rq)
再次查看执行计划
左半部分：
右半部分
table scan变为clustered index seek，看右半部分计划中的estimaterows、estimateio、estimatecpu、tocalsubtreecost等都有很大提升
优化rid lookup前面提到rid lookup是使用非聚集索引时提取了索引外的列产生的一种操作，中文解释为书签查找。
微软有一篇专门的文章http://blogs.msdn.com/b/craigfr/archive/2006/06/30/652639.aspx对此作出了解释。每次书签查找会产生一次随机io，随机io对于磁盘来说是比较耗费资源的，虽然sqlserver优化器认为这个比不用索引的消耗小些因而选择了这个方式，但可能的情况下我们还是要考虑优化。
优化书签查找的方式大致两种，一种是给目前已经使用的索引加入要查询的列，使得查询的列都在索引中；另一种是使索引成为聚集索引。那么可以考虑创建(c_zfbh, d_ksrq, d_jsrq, n_szjy)4键联合索引或将(c_zfbh,d_ksrq)的索引改为聚集索引。
我先采用了聚集索引优化，查询计划的io、cpu、cost都有所提升，主要是totalsubtreecost一项提升较多。按照微软对此项的说明为查询开销，这是一个综合的数值，一般这个开销较小的更好，不过也不绝对。
那么如果用4键联合索引呢？
我发现对比两者的查询计划相差很小，于是我用了set statistics profile on来查看实际的执行情况，这个开关比前面的计划多两列，会返回每个步骤的实际扫描行数和执行次数
列名
说明
rows
各运算符生成的实际行数
executes
运算符执行的次数
先看聚集索引，本次执行耗费8s
再看4键联合索引，本次执行耗费12s，值得一提的是此时两个索引都存在，是sqlserver优化器选择了4键联合索引
相比之下，后者的totalsubtreecost较小因io少，但是前者实际扫描的行数较少，且执行时间更短。我在执行前已使用了dbcc dropcleanbuffers和dbcc freeproccache清除缓存，不过我使用的数据库是虚拟机，在执行效率上经常有波动，后者的执行时间长可能因为索引还没有全部加载到内存中，实际测试时有时后者的时间更短。不过鉴于d_jsrq是存在空值并且检索的时候都要使用(d_jsrq>日期 or d_jsrq is null)这样的条件，前者可能更好。
看懂sqlserver查询计划
http://www.cnblogs.com/fish-li/archive/2011/06/06/2073626.html
msdn逻辑运算符和物理运算符引用
http://msdn.microsoft.com/zh-cn/library/ms191158(v=sql.105)

分析sqlserver查询计划

推荐信息