您的位置:首页 > 其它

row_number()、rank()和dense_rank()的区别以及具体使用

2017-07-26 11:55 399 查看
row_number()、rank()和dense_rank()这三个是Hive内置的分析函数,下面我们来看看他们的区别和具体的使用案例。

首先创建一个文件test

A,1
B,3
C,2
D,3
E,4
F,5
G,6


然后创建hive表:

create table test_rank(a string,b int) row format delimited fields terminated by ',' stored as textfile;


load数据到表中

load data local inpath '/usr/java/test' overwrite into table test_rank;


执行下面的语句

select
a,
row_number() over(order by b) row_number,
rank() over(order by b) rank,
dense_rank() over(order by b) dense_rank
from yijie.test_rank;


结果为:

a   row_number  rank    dense_rank
A       1        1          1
C       2        2          2
D       3        3          3
B       4        3          3
E       5        5          4
F       6        6          5
G       7        7          6


结论:

row_number:不管排名是否有相同的,都按照顺序1,2,3…..n

rank:排名相同的名次一样,同一排名有几个,后面排名就会跳过几次

dense_rank:排名相同的名次一样,且后面名次不跳跃
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  hive