网站首页 > 数据库 > 正文

dba 数据库 GBase 8a集群性能优化之group by 多列hash重分布

开发工具app 数据库 2024-05-20 12 0

对随机分布表进行多列group by操作时，集群默认以group by的第一列对表进行hash重分布。当表数据量大，而group by的第一列唯一值较少时，会造成数据重分布到少数的几个节点，达不到多节点并行处理的效果，影响性能。

原始sql语句，t1是随机分布表： select c1,c2,count(distinct c3) from t1 group by c1,c2; 默认计划： gbase> explain select c1,c2,count(distinct c3) from t1 group by c1,c2; +----+--------------+-----------+---------+---------------------+ | ID | MOTION | OPERATION | TABLE | CONDITION | +----+--------------+-----------+---------+---------------------+ | 01 | [RESULT] | Step | <00> | | | | | GROUP | | GROUP BY c1, c2 | | 00 | [REDIST(c1)] | Table | t1[DIS] | | | | | GROUP | | GROUP BY c1, c2, c3 | +----+--------------+-----------+---------+-------------------

精彩链接

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

dba 数据库性能优化

本文由用户于 2024-05-20 发布在金钥匙，如有疑问，请联系我们。
本文链接：https://www.51969.com/post/18442005.html

上一篇

sql oracle dba linux 不需要删dbf文件，ORA-00376、ORA-01110无法读取dbf文件导致数据库无法启动

下一篇

运维 dba 数据库 Linux 上 postgresql 14 安装 postgis （包含所有依赖包）

发表评论取消回复

返回顶部暗黑模式