本文主要内容

HQL查询语句与MySQL执行顺序的区别;

Hive复合类型的数据查询、正则查询以及Hive独有的排序方式;

Hive语句的表关联语法;

Hive子查询的限制;

Hive开窗函数的语法包含偏移函数、统计函数和排序函数;

Hive抽样查询的语法包含随机抽样、数据块抽样和分桶抽样;

Hive调优分为环境调优和HQL语句调优;

Hive总结与扩展explode函数和lateral 虚拟表的用法。

目录

本文主要内容

第三节 查询语句

3.1 Select 语句结构

3.1.1 HQL与MySQL语句执行顺序区别

3.1.2 复合类型的数据查询

3.1.3 正则查询

3.1.4 排序

3.2 表关联

3.3 Hive视图

3.4 子查询

3.5 开窗函数

3.5.1 Group by分组聚合与窗口聚合函数的区别

3.5.2 语法结构

3.5.3 窗口函数类型

3.6 抽样查询

3.6.1 随机抽样(rand()函数)

3.6.2 数据块抽样(tablesample()函数)

3.6.3 分桶抽样

3.7 Hive 调优

3.7.0 Hive 调优的两种类型

3.7.1 除去多余操作

3.7.2 Distinct聚合优化

3.7.3 使用with as代替子查询

3.7.4 聚合技巧—利用窗口函数grouping sets、cube

3.7.5 Join连接优化

3.7.6 数据倾斜

3.8 总结与函数拓展

3.8.1 总结

3.8.2 扩展函数explode和 lateral 虚拟表

第三节 查询语句

 有红色标记的表示为与MySQL差异的用法

开窗函数很重要,考SQL语句基本必考开窗函数

专门服务复合类型的函数:explode——炸裂函数

Hive常用内置函数与运算符可查看文件https://download.csdn.net/download/weixin_61336263/85883422

3.1 Select 语句结构

SELECT [ALL | DISTINCT] select_expr, select_expr, ...

FROM table_reference

[WHERE where_condition]

[GROUP BY col_list]

[HAVING having_condition]

[CLUSTER BY col_list | [DISTRIBUTE BY col_list] [SORT BY col_list]][ORDER BY col_list]

[LIMIT number];

ORDER BY排序字段 和 limit 后字段 不能是计算字段

!࿰

参考阅读

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: