您好,欢迎访问一九零五行业门户网

oracle分析函数技术详解(配上开窗函数over())

一、oracle分析函数入门 分析函数是什么? 分析函数是oracle专门用于 解决复杂报表统计需求 的功能强大的函数, 它可以在数据中进行分组然后计算基于组的某种统计 ,并且每一组的每一行都可以返回一个统计。 分析函数和聚合函数的不同之处是什么? 普通的聚
一、oracle分析函数入门分析函数是什么?
分析函数是oracle专门用于解决复杂报表统计需求的功能强大的函数,它可以在数据中进行分组然后计算基于组的某种统计值,并且每一组的每一行都可以返回一个统计值。
分析函数和聚合函数的不同之处是什么?
普通的聚合函数用group by分组,每个分组返回一个统计值,而分析函数采用partition by分组,并且每组每行都可以返回一个统计值。
分析函数的形式
分析函数带有一个开窗函数over(),包含三个分析子句:分组(partition by), 排序(order by), 窗口(rows) ,他们的使用形式如下:over(partition by xxx order by yyy rows between zzz)。
注:窗口子句在这里我只说rows方式的窗口,range方式和滑动窗口也不提
分析函数例子(在scott用户下模拟)
示例目的:显示各部门员工的工资,并附带显示该部分的最高工资。
--显示各部门员工的工资,并附带显示该部分的最高工资。select e.deptno, e.empno, e.ename, e.sal, last_value(e.sal) over(partition by e.deptno order by e.sal rows --unbounded preceding and unbouned following针对当前所有记录的前一条、后一条记录,也就是表中的所有记录 --unbounded:不受控制的,无限的 --preceding:在...之前 --following:在...之后 between unbounded preceding and unbounded following) max_sal from emp e;
运行结果:
示例目的:按照deptno分组,然后计算每组值的总和
select empno, ename, deptno, sal, sum(sal) over(partition by deptno order by ename) max_sal from scott.emp;
运行结果:
示例目的:对各部门进行分组,并附带显示第一行至当前行的汇总
select empno, ename, deptno, sal, --注意rows between unbounded preceding and current row 是指第一行至当前行的汇总 sum(sal) over(partition by deptno order by ename rows between unbounded preceding and current row) max_sal from scott.emp;
运行结果:
示例目标:当前行至最后一行的汇总
select empno, ename, deptno, sal, --注意rows between current row and unbounded following 指当前行到最后一行的汇总 sum(sal) over(partition by deptno order by ename rows between current row and unbounded following) max_sal from scott.emp;
运行结果:
示例目标:当前行的上一行(rownum-1)到当前行的汇总
select empno, ename, deptno, sal, --注意rows between 1 preceding and current row 是指当前行的上一行(rownum-1)到当前行的汇总 sum(sal) over(partition by deptno order by ename rows between 1 preceding and current row) max_sal from scott.emp;
运行结果:
示例目标:   当前行的上一行(rownum-1)到当前行的下辆行(rownum+2)的汇总
select empno, ename, deptno, sal, --注意rows between 1 preceding and 1 following 是指当前行的上一行(rownum-1)到当前行的下辆行(rownum+2)的汇总 sum(sal) over(partition by deptno order by ename rows between 1 preceding and 2 following) max_sal from scott.emp;
运行结果:
二、理解over()函数1.1、两个order by的执行时机
分析函数(以及与其配合的开窗函数over())是在整个sql查询结束后(sql语句中的order by的执行比较特殊)再进行的操作, 也就是说sql语句中的order by也会影响分析函数的执行结果:
a) 两者一致:如果sql语句中的order by满足与分析函数配合的开窗函数over()分析时要求的排序,即sql语句中的order by子句里的内容和开窗函数over()中的order by子句里的内容一样,
那么sql语句中的排序将先执行,分析函数在分析时就不必再排序;
b) 两者不一致:如果sql语句中的order by不满足与分析函数配合的开窗函数over()分析时要求的排序,即sql语句中的order by子句里的内容和开窗函数over()中的order by子句里的内容不一样,
那么sql语句中的排序将最后在分析函数分析结束后执行排序。
1.2、开窗函数over()分析函数中的分组/排序/窗口
      开窗函数over()分析函数包含三个分析子句:分组子句(partition by), 排序子句(order by), 窗口子句(rows)
      窗口就是分析函数分析时要处理的数据范围,就拿sum来说,它是sum窗口中的记录而不是整个分组中的记录,因此我们在想得到某个栏位的累计值时,我们需要把窗口指定到该分组中的第一行数据到当前行, 如果你指定该窗口从该分组中的第一行到最后一行,那么该组中的每一个sum值都会一样,即整个组的总和。
      窗口子句在这里我只说rows方式的窗口,range方式和滑动窗口也不提。
窗口子句中我们经常用到指定第一行,当前行,最后一行这样的三个属性:
第一行是 unbounded preceding,
当前行是 current row,
最后一行是 unbounded following,
注释:
当开窗函数over()出现分组(partition by)子句时,
unbounded preceding即第一行是指表中一个分组里的第一行, unbounded following即最后一行是指表中一个分组里的最后一行;
当开窗函数over()省略了分组(partition by)子句时,
unbounded preceding即第一行是指表中的第一行, unbounded following即最后一行是指表中的最后一行。
窗口子句不能单独出现,必须有order by子句时才能出现,
例如:
last_value(sal) over(partition by deptno order by sal rows between unbounded preceding and unbounded following)
以上示例指定窗口为整个分组。而出现order by子句的时候,不一定要有窗口子句,但效果会很不一样,此时的窗口默认是当前组的第一行到当前行!
如果省略分组,则把全部记录当成一个组。
a) 如果存在order by则默认窗口是unbounded preceding and current row   --当前组的第一行到当前行
b) 如果这时省略order by则窗口默认为unbounded preceding and unbounded following  --整个组
而无论是否省略分组子句,如下结论都是成立的:
1、窗口子句不能单独出现,必须有order by子句时才能出现。
2、当省略窗口子句时:
a) 如果存在order by则默认的窗口是unbounded preceding and current row  --当前组的第一行到当前行,即在当前组中,第一行到当前行
b) 如果同时省略order by则默认的窗口是unbounded preceding and unbounded following  --整个组
所以,
lag(sal) over(order by sal) 解释
over(order by salary)表示意义如下:
首先,我们要知道由于省略分组子句,所以当前组的范围为整个表的数据行,
然后,在当前组(此时为整个表的数据行)这个范围里执行排序(即order by salary),
最后,我们知道分析函数lag(sal)在当前组(此时为整个表的数据行)这个范围里的窗口范围为当前组的第一行到当前行,即分析函数lag(sal)在这个窗口范围执行。
参见:
oracle的lag和lead分析函数
oracle分析函数row_number()|rank()|lag()使用详解
1.3、帮助理解over()的实例
例1:关注点:sql无排序,over()排序子句省略
select deptno, empno, ename, sal, last_value(sal) over(partition by deptno)from emp;
运行结果:
例2:关注点:sql无排序,over()排序子句有,窗口省略
select deptno, empno, ename, sal, last_value(sal) over(partition by deptno order by sal desc) from emp;
运行结果:
例3:关注点:sql无排序,over()排序子句有,窗口也有,窗口特意强调全组数据
select deptno, empno, ename, sal, last_value(sal) over(partition by deptno order by sal rows between unbounded preceding and unbounded following) max_sal from emp;
运行结果:
例4:关注点:sql有排序(正序),over()排序子句无,先做sql排序再进行分析函数运算
select deptno, mgr, ename, sal, hiredate, last_value(sal) over(partition by deptno) last_value from emp where deptno = 30 order by deptno, mgr;
运行结果:
例5:关注点:sql有排序(倒序),over()排序子句无,先做sql排序再进行分析函数运算
select deptno, mgr, ename, sal, hiredate, last_value(sal) over(partition by deptno) last_value from emp where deptno = 30 order by deptno, mgr desc;
运行结果:
例6:关注点:sql有排序(倒序),over()排序子句有,窗口子句无,此时的运算是:sql先选数据但是不排序,而后排序子句先排序并进行分析函数处理(窗口默认为第一行到当前行),最后再进行sql排序
select deptno, mgr, ename, sal, hiredate, min(sal) over(partition by deptno order by sal asc) last_value from emp where deptno = 30 order by deptno, mgr desc;
运行结果:
select deptno, mgr, ename, sal, hiredate, min(sal) over(partition by deptno order by sal desc) last_value from emp where deptno = 30 order by deptno, mgr desc;
运行结果:
三、常见分析函数详解为了方便进行实践,特将演示表和数据罗列如下:
一、创建表
create table t( bill_month varchar2(12) , area_code number, net_type varchar(2), local_fare number );
二、插入数据
insert into t values('200405',5761,'g', 7393344.04); insert into t values('200405',5761,'j', 5667089.85); insert into t values('200405',5762,'g', 6315075.96); insert into t values('200405',5762,'j', 6328716.15); insert into t values('200405',5763,'g', 8861742.59); insert into t values('200405',5763,'j', 7788036.32); insert into t values('200405',5764,'g', 6028670.45); insert into t values('200405',5764,'j', 6459121.49); insert into t values('200405',5765,'g', 13156065.77); insert into t values('200405',5765,'j', 11901671.70); insert into t values('200406',5761,'g', 7614587.96); insert into t values('200406',5761,'j', 5704343.05); insert into t values('200406',5762,'g', 6556992.60); insert into t values('200406',5762,'j', 6238068.05); insert into t values('200406',5763,'g', 9130055.46); insert into t values('200406',5763,'j', 7990460.25); insert into t values('200406',5764,'g', 6387706.01); insert into t values('200406',5764,'j', 6907481.66); insert into t values('200406',5765,'g', 13562968.81); insert into t values('200406',5765,'j', 12495492.50); insert into t values('200407',5761,'g', 7987050.65); insert into t values('200407',5761,'j', 5723215.28); insert into t values('200407',5762,'g', 6833096.68); insert into t values('200407',5762,'j', 6391201.44); insert into t values('200407',5763,'g', 9410815.91); insert into t values('200407',5763,'j', 8076677.41); insert into t values('200407',5764,'g', 6456433.23); insert into t values('200407',5764,'j', 6987660.53); insert into t values('200407',5765,'g', 14000101.20); insert into t values('200407',5765,'j', 12301780.20); insert into t values('200408',5761,'g', 8085170.84); insert into t values('200408',5761,'j', 6050611.37); insert into t values('200408',5762,'g', 6854584.22); insert into t values('200408',5762,'j', 6521884.50); insert into t values('200408',5763,'g', 9468707.65); insert into t values('200408',5763,'j', 8460049.43); insert into t values('200408',5764,'g', 6587559.23); insert into t values('200408',5764,'j', 7342135.86); insert into t values('200408',5765,'g', 14450586.63); insert into t values('200408',5765,'j', 12680052.38); commit;
三、first_value()与last_value():求最值对应的其他属性
问题、取出每月通话费最高和最低的两个地区。
select bill_month, area_code, sum(local_fare) local_fare, first_value(area_code) over(partition by bill_month order by sum(local_fare) desc rows between unbounded preceding and unbounded following) firstval, last_value(area_code) over(partition by bill_month order by sum(local_fare) desc rows between unbounded preceding and unbounded following) lastval from t group by bill_month, area_code order by bill_month
运行结果:
四、rank(),dense_rank()与row_number():求排序
rank,dense_rank,row_number函数为每条记录产生一个从1开始至n的自然数,n的值可能小于等于记录的总数。这3个函数的唯一区别在于当碰到相同数据时的排名策略。
①row_number:
row_number函数返回一个唯一的值,当碰到相同数据时,排名按照记录集中记录的顺序依次递增。
②dense_rank:
dense_rank函数返回一个唯一的值,当碰到相同数据时,此时所有相同数据的排名都是一样的。
③rank:
rank函数返回一个唯一的值,当碰到相同的数据时,此时所有相同数据的排名是一样的,同时会在最后一条相同记录和下一条不同记录的排名之间空出排名。
演示数据在oracle自带的scott用户下:
1、rank()值相同时排名相同,其后排名跳跃不连续
select * from (select deptno, rank() over(partition by deptno order by sal desc) rw, ename, sal from scott.emp) where rw 4;
运行结果:
2、dense_rank()值相同时排名相同,其后排名连续不跳跃
select * from (select deptno, dense_rank() over(partition by deptno order by sal desc) rw, ename, sal from scott.emp) where rw 4;
运行结果:
3、row_number()值相同时排名不相等,其后排名连续不跳跃
select * from (select deptno, row_number() over(partition by deptno order by sal desc) rw, ename, sal from scott.emp) where rw 4;
运行结果:
五、lag()与lead():求之前或之后的第n行
lag和lead函数可以在一次查询中取出同一字段的前n行的数据和后n行的值。这种操作可以使用对相同表的表连接来实现,不过使用lag和lead有更高的效率。
lag(arg1,arg2,arg3)
第一个参数是列名,
第二个参数是偏移的offset,
第三个参数是超出记录窗口时的默认值。
举例如下:
sql> select *  from kkk;
id name                                                  
---------- --------------------                                  
         1 1name                                                 
         2 2name                                                 
         3 3name                                                 
         4 4name                                                 
         5 5name                                                 
sql> select id,name,lag(name,1,0) over(order by id) from kkk;
id name                 lag(name,1,0)over(orderbyid)     
---------- -------------------- ----------------------------     
         1 1name                0                                
         2 2name                1name                            
         3 3name                2name                            
         4 4name                3name                            
         5 5name                4name
sql> select id,name,lead(name,1,0) over(order by id) from kkk;
id name                 lead(name,1,0)over(orderbyid)    
---------- -------------------- -----------------------------    
         1 1name                2name                            
         2 2name                3name                            
         3 3name                4name                            
         4 4name                5name                            
         5 5name                0
sql> select id,name,lead(name,2,0) over(order by id) from kkk;                                                                                                              
        id name                 lead(name,2,0)over(orderbyid)    
---------- -------------------- -----------------------------    
         1 1name                3name                            
         2 2name                4name                            
         3 3name                5name                            
         4 4name                0                                
         5 5name                0 
sql> select id,name,lead(name,1,'linjiqin') over(order by id) from kkk;
id name                 lead(name,1,'alsdfjlasdjfsaf')                   
---------- -------------------- ------------------------------                   
         1 1name                2name                                            
         2 2name                3name                                            
         3 3name                4name                                            
         4 4name                5name                                            
         5 5name                linjiqin  
---------------------------------------------------------------------------------------
六、rollup()与cube():排列组合分组
1)、group by rollup(a, b, c):
首先会对(a、b、c)进行group by,
然后再对(a、b)进行group by,
其后再对(a)进行group by,
最后对全表进行汇总操作。
2)、group by cube(a, b, c):
则首先会对(a、b、c)进行group by,
然后依次是(a、b),(a、c),(a),(b、c),(b),(c),
最后对全表进行汇总操作。
1、生成演示数据:
connected to oracle database 10g enterprise edition release 10.2.0.1.0
connected as ds_trade
sql> conn system/oracle as sysdba
connected to oracle database 10g enterprise edition release 10.2.0.3.0
connected as sys
sql> create table scott.t as select * from dba_indexes;
table created
sql> connect scott/oracle
connected to oracle database 10g enterprise edition release 10.2.0.3.0
connected as scott
sql>
2、普通group by体验
sql> select owner, index_type, status, count(*) from t where owner like 'sy%' group by owner, index_type, status;
3、group by rollup(a,b,c)
group by rollup(a, b, c):
首先会对(a、b、c)进行group by,
然后再对(a、b)进行group by,
其后再对(a)进行group by,
最后对全表进行汇总操作。
sql> select owner, index_type, status, count(*) from t where owner like 'sy%' group by rollup(owner, index_type, status);
4、group by cube(a,b,c)
group by cube(a, b, c):
则首先会对(a、b、c)进行group by,
然后依次是(a、b),(a、c),(a),(b、c),(b),(c),
最后对全表进行汇总操作。
sql> select owner, index_type, status, count(*) from t where owner like 'sy%' group by cube(owner, index_type, status);
七、max(),min(),sun()与avg():求移动的最值总和与平均值
问题:计算出各个地区连续3个月的通话费用的平均数(移动平均值)
select area_code, bill_month, local_fare, sum(local_fare) over(partition by area_code order by to_number(bill_month) range between 1 preceding and 1 following) 3month_sum, avg(local_fare) over(partition by area_code order by to_number(bill_month) range between 1 preceding and 1 following) 3month_avg, max(local_fare) over(partition by area_code order by to_number(bill_month) range between 1 preceding and 1 following) 3month_max, min(local_fare) over(partition by area_code order by to_number(bill_month) range between 1 preceding and 1 following) 3month_min from (select t.area_code, t.bill_month, sum(t.local_fare) local_fare from t group by t.area_code, t.bill_month)
运行结果:
问题:求各地区按月份累加的通话费
select area_code, bill_month, local_fare, sum(local_fare) over(partition by area_code order by bill_month asc) last_sum_value from (select t.area_code, t.bill_month, sum(t.local_fare) local_fare from t group by t.area_code, t.bill_month) order by area_code, bill_month
运行结果:
--------------------------------------------------------------------------
blog:http://www.cnblogs.com/linjiqin/
j2ee、android、linux、oracle qq交流群:142463980、158560018(满)
另见:《oracle分析函数row_number()|rank()|lag()使用详解》
其它类似信息

推荐信息