Mysql 8 新特性 window functions 的作用
MySQL 8.0的新特性包括:
- 对Unicode 9.0的开箱即用的完整支持
- 支持窗口函数和递归SQL语法,这在以往是不可能或者很难才能编写这样的查询语句
- 对原生JSON数据和文档存储功能的增强支持
- MySQL 8.0的发布,跳过了多个版本号(从5.5开始),由于6.0修改和7.0是用来保留做MySQL的集群版本,因此采用了8.0的版本号。
1. 问题
Mysql 8.0.2 中新增加了一个主要功能 - 窗口函数 window function
这个功能具体是解决什么问题?下面先看一个SQL查询的场景,看一下平时我们是怎么做的,然后再看一下如何使用窗口函数来更方便的解决
(1)准备测试表和数据
建一个简单的电影信息表,字段有:
ID release_year(发行年份) category_id(所属分类ID) rating(评分) CREATE TABLE films ( id int(11), release_year int(11), category_id int(11), rating decimal(3,2) )
插入测试数据
insert into films2 values (1,2015,1,8.00), (2,2015,2,8.50), (3,2015,3,9.00), (4,2016,2,8.20), (5,2016,1,8.40), (6,2017,2,7.00);
整体形式如下
(2)查询需求
查询每一年中的平均评分,要求每条记录后面都显示当年的平均评分
例如 2015 年,有3条记录,8.00, 8.50, 9.00 的平均分是 8.5,2016年有2条记录,平均分是 8.3,2017年有1条记录,平均分为 7.00
最终结果的形式如下:
我们可以使用子查询来计算各年的平均分,然后使用 join 把结果连接回去
SELECT f.id, f.release_year, f.rating, years.year_avg FROM films f LEFT JOIN ( SELECT f.release_year, AVG(rating) AS year_avg FROM films f GROUP BY f.release_year ) years ON f.release_year = years.release_year
是不是有点复杂,下面看下窗口函数的处理方式
2. window functions 的解决方案
什么是 window functions
window functions 是对一组数据进行计算,与使用 group by 时不同,不会进行单行的结果输出,而是与每条记录相关联
语法示例:
SELECT function_name OVER ( window_definition ) FROM (...)
window_definition 是定义要计算的记录集合,就像是一个小窗口,在整体数据集合上显示出一部分
function_name 指定了对于窗口中的数据集合执行什么计算
回头看下上面的那个查询,需要计算每部电影所在年份的所有电影平均评分,下面使用窗口函数来处理
SELECT f.id, f.release_year, f.category_id, f.rating, AVG(rating) OVER (PARTITION BY release_year) AS year_avg FROM films f
window_definition 部分使用了 PARTITION BY 从句,它告诉数据库把结果数据集合分割成更小的部分,把 release_year 相同的放在一起,函数 AVG(rating) 会对每个窗口数据进行计算,然后把结果放到每一行中
查询示例1
计算每部电影在所属年份中的评分排行位置
查询语句
SELECT f.id, f.release_year, f.category_id, f.rating, RANK() OVER (PARTITION BY release_year ORDER BY rating DESC) AS year_rank FROM films f
window_definition 部分使用 PARTITION BY 来根据 release_year 划分窗口,使用 ORDER BY 在窗口内排序
RANK() 函数可以返回一行数据在本窗口中的位置
查询结果
查询示例2
查看每部电影在总排行榜中的位置
查询语句
SELECT f.id, f.release_year, f.category_id, f.rating, RANK() OVER (ORDER BY rating DESC) AS general_rank FROM films f order by id
主语句中的 order by 保证了整个数据集的排序
window_definition 中没有使用 PARTITION BY,那么就是把整个结果集合当做一个窗口,ORDER BY 对窗口中的数据根据 rating 做降序排序,把得分最高的放前面
RANK() 函数取得每条记录在窗口中的位置
查询结果
3. 小结
窗口函数是 Mysql 8.0.2 中的高级特性,可以方便的执行聚合计算,而不用对结果集进行实际的聚合,大大增加了灵活性、可读性,更便于维护
- 微软开源 C++ REST SDK
- 使用Autofac在ASP.NET Web API上实现依赖注入
- Universal-Image-Loader完全解析--从源代码分析Universal-Image-Loader中的线程池
- 我是怎样爬下6万共享单车数据并进行分析的(附代码)
- 数据库压缩备份提高备份效率
- 教你用TensorFlow和自编码器模型生成手写数字(附代码)
- 开源OCR引擎Tesseract
- 数据仓库中如何使用索引
- PowerBI 引入时间智能
- 列存储索引1:初识列存储索引
- 通过案例来学习TCP的MSS、MTU
- webview和js交互
- 比较列存储索引与行索引
- SSIS技巧--优化数据流缓存
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- ApiBoot v2.3.x分支第一个版本发布,重构源码架构设计
- Python全栈(七)Flask框架之1.Flask简介与URL和视图介绍
- 两个CSS知识点:BFC和选择器权重
- C语言入门系列之9.预处理
- Python爬虫常见异常及解决办法
- 理解nodejs中js和c++的通信原理
- 如何使用FFmpeg将互联网直播点播平台内直播视频流转化为HLS流?
- 记一次nodejs问题排查
- 使用Go语言编译互联网视频直播点播平台EasyDSS出现ld returned 1 exit status错误
- c/c++补完计划(四): 字节对齐和虚继承
- Python 不用selenium 带你高效爬取京东商品评论
- 《闲扯Redis六》Redis五种数据类型之Hash型
- rocketmq学习2
- Python全栈(八)Flask项目实战之1.项目搭建
- 一起来读开源项目的代码-Agar.io为例