微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

postgresql/hive中函数学习

目前postgresql中的部分函数在hive中也是存在的,所以今天就以postgresql为例来进行说明,这个过程同时可以应用到hive中。

1、创建表

CREATETABLEemployee(
empidINT,deptidINT,salaryDECIMAL(10,2)
);

2、导入数据

INSERTINTOemployeeVALUES(1,10,5500.00);
INSERTINTOemployeeVALUES(2,4500.00);
INSERTINTOemployeeVALUES(3,20,1900.00);
INSERTINTOemployeeVALUES(4,4800.00);
INSERTINTOemployeeVALUES(6,40,14500.00);
INSERTINTOemployeeVALUES(7,44500.00);
INSERTINTOemployeeVALUES(10,44500.00);
INSERTINTOemployeeVALUES(11,44501.00);
INSERTINTOemployeeVALUES(8,50,6500.00);
INSERTINTOemployeeVALUES(9,7500.00);

3、应用

--每个部门工资最高的
select*from(
selecte.*,row_number()over(partitionbye.deptidorderbye.salarydesc)rankfromemployeee
)ee
whereee.rank=1;


--应该用rank,对于工资相同的应该都显示出来
select*from(
selecte.*,rank()over(partitionbye.deptidorderbye.salarydesc)rankfromemployeee
)ee
whereee.rank=1;


--rank和dense_rank的区别就是前者占位,后者不占位
--ntile可以看作是把有序的数据集合平均分配到expr指定的数量的桶中,将桶号分配给每一行。
--如果不能平均分配,则较小桶号的桶分配额外的行,并且各个桶中能放的行数最多相差1。
select
e.*,ntile(3)over(partitionbye.deptidorderbye.salarydesc)ntile,rank()over(partitionbye.deptidorderbye.salarydesc)rank,dense_rank()over(partitionbye.deptidorderbye.salarydesc)drank,row_number()over(partitionbye.deptidorderbye.salarydesc)rownum,first_value(salary)over(partitionbye.deptidorderbye.salarydesc)fv,last_value(salary)over(partitionbye.deptidorderbye.salaryasc)lvfromemployeee


好了,就这些了,通过例子能很清楚的看到各个函数的应用

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐