系列文章目录
【SQL开发实战技巧】系列(一):关于SQL不得不说的那些事
【SQL开发实战技巧】系列(二):简单单表查询
【SQL开发实战技巧】系列(三):SQL排序的那些事
【SQL开发实战技巧】系列(四):从执行计划讨论UNION ALL与空字符串&UNION与OR的使用注意事项
【SQL开发实战技巧】系列(五):从执行计划看IN、EXISTS 和 INNER JOIN效率,我们要分场景不要死记网上结论
【SQL开发实战技巧】系列(六):从执行计划看NOT IN、NOT EXISTS 和 LEFT JOIN效率,记住内外关联条件不要乱放
【SQL开发实战技巧】系列(七):从有重复数据前提下如何比较出两个表中的差异数据及对应条数聊起
【SQL开发实战技巧】系列(八):聊聊如何插入数据时比约束更灵活的限制数据插入以及怎么一个insert语句同时插入多张表
【SQL开发实战技巧】系列(九):一个update误把其他列数据更新成空了?Merge改写update!给你五种删除重复数据的写法!
【SQL开发实战技巧】系列(十):从拆分字符串、替换字符串以及统计字符串出现次数说起
【SQL开发实战技巧】系列(十一):拿几个案例讲讲translate|regexp_replace|listagg|wmsys.wm_concat|substr|regexp_substr常用函数
【SQL开发实战技巧】系列(十二):三问(如何对字符串字母去重后按字母顺序排列字符串?如何识别哪些字符串中包含数字?如何将分隔数据转换为多值IN列表?)
【SQL开发实战技巧】系列(十三):讨论一下常用聚集函数&通过执行计划看sum()over()对员工工资进行累加
【SQL开发实战技巧】系列(十四):计算消费后的余额&计算银行流水累计和&计算各部门工资排名前三位的员工
【SQL开发实战技巧】系列(十五):查找最值所在行数据信息及快速计算总和百之max/min() keep() over()、fisrt_value、last_value、ratio_to_report
【SQL开发实战技巧】系列(十六):数据仓库中时间类型操作(初级)日、月、年、时、分、秒之差及时间间隔计算
【SQL开发实战技巧】系列(十七):数据仓库中时间类型操作(初级)确定两个日期之间的工作天数、计算—年中周内各日期出现次数、确定当前记录和下一条记录之间相差的天数
【SQL开发实战技巧】系列(十八):数据仓库中时间类型操作(进阶)INTERVAL、EXTRACT以及如何确定一年是否为闰年及周的计算
【SQL开发实战技巧】系列(十九):数据仓库中时间类型操作(进阶)如何一个SQL打印当月或一年的日历?如何确定某月内第一个和最后—个周内某天的日期?
【SQL开发实战技巧】系列(二十):数据仓库中时间类型操作(进阶)获取季度开始结束时间以及如何统计非连续性时间的数据
【SQL开发实战技巧】系列(二十一):数据仓库中时间类型操作(进阶)识别重叠的日期范围,按指定10分钟时间间隔汇总数据
【SQL开发实战技巧】系列(二十二):数仓报表场景☞ 从分析函数效率一定快吗聊一聊结果集分页和隔行抽样实现方式
【SQL开发实战技巧】系列(二十三):数仓报表场景☞ 如何对数据排列组合去重以及通过如何找到包含最大值和最小值的记录这个问题再次用执行计划给你证明分析函数性能不一定高
【SQL开发实战技巧】系列(二十四):数仓报表场景☞通过案例执行计划详解”行转列”,”列转行”是如何实现的
【SQL开发实战技巧】系列(二十五):数仓报表场景☞结果集中的重复数据只显示一次以及计算部门薪资差异高效的写法以及如何对数据进行快速分组
【SQL开发实战技巧】系列(二十六):数仓报表场景☞聊聊ROLLUP、UNION ALL是如何分别做分组合计的以及如何识别哪些行是做汇总的结果行
文章目录
- 系列文章目录
- 前言
- 一、确定指定年份季度的开始日期和结束日期
- 二、补充时间范围内丢失的值
- 三、按照给定的时间单位进行查找
- 四、使用日期的特殊部分比较记录
- 总结
前言
本篇文章讲解的主要内容是:汇总报表时常要求按季度分类汇总这就需要通过给定年份获取对应的季度开始结束时间、业务数据不连续的情况下如何统计所有年份数据、如何统计相同月份与周内日期聘用的员工、如何返回2月或12月聘用的所有员工以及周二聘用的所有员工
【SQL开发实战技巧】这一系列博主当作复习旧知识来进行写作,毕竟SQL开发在数据分析场景非常重要且基础,面试也会经常问SQL开发和调优经验,相信当我写完这一系列文章,也能再有所收获,未来面对SQL面试也能游刃有余~。
一、确定指定年份季度的开始日期和结束日期
生成汇总报表时常要求按季度分类汇总这就需要通过给定年份提取对应的季度信息,
那么问题来了,怎么快速获取某个季度的开始结束日期呢?
接下来给出解决方案:
SQL> with t as 2 (select to_char(sysdate, 'yyyy') as 年, level as sn 3 from dual 4 connect by level <= 4 5 ) 6 select sn as 季度, 7 (sn - 1) * 3 + 1 as 开始月份, 8 add_months(trunc(to_date(年, 'yyyy'), 'y'), (sn - 1) * 3) as 开始日期, 9 add_months(trunc(to_date(年, 'yyyy'), 'y'), sn * 3) - 1 as 结束日期 10 from t; 季度 开始月份 开始日期 结束日期---------- ---------- ----------- ----------- 1 1 2023-1-1 2023-3-31 2 4 2023-4-1 2023-6-30 3 7 2023-7-1 2023-9-30 4 10 2023-10-1 2023-12-31SQL>
这种枚举季度信息的语句在写报表查询时可能会用到有必要记录下来备用。
二、补充时间范围内丢失的值
有时业务数据并不是连续的如下面的数据:
SQL> select empno,hiredate from emp order by 2;EMPNO HIREDATE----- ----------- 7369 1980-12-17 7499 1981-2-20 7521 1981-2-22 7566 1981-4-2 7698 1981-5-1 7782 1981-6-9 7844 1981-9-8 7654 1981-9-28 7839 1981-11-17 7900 1981-12-3 7902 1981-12-3 7934 1982-1-23 7788 1987-4-19 7876 1987-5-23 1001 2021-10-9 115 rows selected
有的年份没有招聘员工,这时按年份查询招聘人数结果如下:
SQL> select to_char(hiredate,'yyyy') as year, count(*) as cnt 2 from emp 3 group by to_char(hiredate,'yyyy') 4 order by 1;YEAR CNT--------------------------------------------------------------------------- ----------1980 11981 101982 11987 22021 1SQL>
为了分析数据一般需要把表中没有的年份(如1983年)内的人数统计为0,这时就需要先根据表中的信息生成一个年份的枚举列表。
SQL> with t as 2 (select extract(year from min(hiredate)) as 开始年份, 3 extract(year from max(hiredate)) as 结束年份 4 from emp where empno1001) 5 select 开始年份 + (level - 1) as 年份 6 from t 7 connect by level <= ((结束年份 - 开始年份) + 1); 年份---------- 1980 1981 1982 1983 1984 1985 1986 19878 rows selected
通过这个列表关联查询就可以得到所有年份的数据。
SQL> with t as 2 (select extract(year from min(hiredate)) as 开始年份, 3 extract(year from max(hiredate)) as 结束年份 4 from emp 5 where empno 1001), 6 t1 as 7 (select 开始年份 + (level - 1) as 年份 8 from t 9 connect by level <= ((结束年份 - 开始年份) + 1)) 10 select t1.年份, count(emp.empno) as 聘用人数 11 from emp 12 right join t1 13 on (extract(year from emp.hiredate) = t1.年份) 14 group by 年份 15 order by 1; 年份 聘用人数---------- ---------- 1980 1 1981 10 1982 1 1983 0 1984 0 1985 0 1986 0 1987 28 rows selected
三、按照给定的时间单位进行查找
有时需要查找特定的条件如要求返回2月或12月聘用的所有员工以及周二聘用的所有员工。
若要得到三个条件返回结果的合集用to_char
函数分别确认雇佣日期是几月及周几再过滤就可以。
SQL> select ename,hiredate,to_char(hiredate,'day') as 星期 2 from emp 3 where to_char(hiredate,'mm') in('02','12') 4 or to_char(hiredate,'d')='3';ENAME HIREDATE 星期---------- ----------- ---------------------------------------------------------------------------SMITH 1980-12-17 星期三ALLEN 1981-2-20 星期五WARD 1981-2-22 星期日CLARK 1981-6-9 星期二KING 1981-11-17 星期二TURNER 1981-9-8 星期二JAMES 1981-12-3 星期四FORD 1981-12-3 星期四8 rows selected
要点在于要避免字符集的影响如这里分别用to_char(hiredate,'mm')
及to_char(hiredate,'d')
来生成与字符集无关的数值信息。
四、使用日期的特殊部分比较记录
在报表统计中常有同期对比的需求演示案例需求为:
统计相同月份与周内日期聘用的员工,如:有两个员工都是3月份周一聘用的则可以用分析函数计算次数然后进行过滤语句如下:
SQL> SQL> select ename,hiredate,to_char(hiredate,'mon day') as 星期 2 from ( 3 select ename,hiredate,count(*)over(partition by to_char(hiredate,'mon day')) as ct 4 from emp 5 ) 6 where ct >1;ENAME HIREDATE 星期---------- ----------- ---------------------------------------------------------------------------FORD 1981-12-3 12月 星期四JAMES 1981-12-3 12月 星期四SQL>
上述语句中要注意以下几点:
- 我们使用了分析函数COUNT()over(),这样可以只访问一次emp就同时得到了明细(ename,hiredate)及汇总信息(cnt)。与分析函数之前需要两次访问emp的写法相比提高了效率。
- 因为不需要过滤to_char函数的结果这里可以不必使用”mmd”写法。
总结
以上四种案例是仓库报表统计中常见又容易出错的几种场景,是博主几个粉丝网友提问的,博主总结发出来的!