您的位置:首页 > 数据库

使用嵌套子查询优化hive的SQL

2015-10-13 10:56 260 查看
[Author]: kwu

使用子查询优化hive的SQL

在1亿条数据中执行一条简单的语句,查询只访问主站一次的用户数量:

[sql] view
plaincopy

select count(*) as cnt from tracklog group by cookieid having cnt=1 ;

查询反应很慢,半小时都未出结果

使用嵌套子查询优化hive-SQL

[sql] view
plaincopy

select count(t.cookieid) from (select count(cookieid) as cnt,cookieid from tracklog group by cookieid having cnt=1 ) t;

执行效率明显提高,同时Spark-SQL也完美支持这种子查询

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: