您的位置:首页 > 大数据

关于hive的总结

2017-10-25 11:11 155 查看

                              hive的总结:

group by:

     group by中有若干陷阱,首先,group by中不能使用当前层次中select查询字段的别名,如:select  name a,count(*) from student group by a;这句查询语句是错误的,

但是,group by可以使用子查询中select查询字段的别名,如:select m.a,count(*) from (select name a from student)m group by m.a;  但是select m.name,count(*) from (select name a from student)m group by m.name;都是错误的,错误原因是子查询中使用了别名后,外层查询只能通过别名来对其进行操作。所以:内层查询使用别名时,外层select这个字段必须使用其别名,而且group
by必须和当前层次的select中的字段名称相同(哪怕有别名也不能用)

where和having:

where语句中不能使用当前层次查询的聚合函数,如果要使用当前层次的聚合函数,则必须使用having,当然,where可以使用子查询的聚合函数如:select m.a,m.b,count(*) from (select name a,count(*) b from student  group by name)m where m.b group by m.a,m.b;  此处where中就使用了m.b也就是子查询的聚合函数,注意不能使用m.count(*)

所以:where语句中不能使用聚合函数,having语句可以,where语句中可以使用子查询的聚合函数,但是必须以别名的形式表示
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息