前几日在qq群,碰到了一个关于pg查询的问题,本人想出了一些方法,记录下来,以后可能会用得到
数据基础:t_city存储城市的面数据,数据量346条,xzqhdm存储行政区划点数据,数据量:712182条
需求:查询行政区划数据中,被城市的面包含的点
第一种方法:
SELECT * from xzqhdm as xz where xz.shape is not null and EXISTS (select ci.id from t_city as ci where st_intersects(ci.geom,xz.shape) LIMIT 1) LIMIT 10000
查询10000个点用了3.7秒,当只查询点信息,这种方式是最快的(不输出面信息)
查询方式和程序中处理比较像:
第二种
select * from xzqhdm xz left JOIN t_city as ci on st_intersects(ci.geom,xz.shape) where xz.shape is not null LIMIT 10000
查询10000 个点用了13秒,比第一种慢,但是会携带面信息
查询方式,利用左连接,将两张表以包含关系结合然会返回需要的条数
第三种
如果数据变化不大的情况,可以将这种关联关系事先存在一张表中,可以达到毫秒级查询速度,数据变动之后,根据变化的数据更新关系即可
关于EXISTS 和 IN 的索引问题
in 是把外表和内表作hash join,而exists是对外表作loop,每次loop再对内表进行查询;
INT 的执行过程:
在in执行的过程中,用到了外层查询上的连接字段索引,首先执行in语句,然后将结果缓存起来,之后遍历t1表,将满足结果的加入结果集,所以执行次数为t1.length*t2.length次。
EXISTS 的执行过程:
用到了内层查询上的连接字段索引,exists执行次数为t1.length,不缓存exists的结果集
具体需求,具体应用
关于NOT EXISTS 和 NOT IN的索引问题
NOT IN 的执行过程:
因为not in实质上等于
!= and != ···
,因为!=不会使用索引,故not in不会使用索引。NOT EXISTS 的执行过程:
执行过程和exists一样,用到了内层查询上的关联字段索引,exists()执行次数为t1.length,不缓存exists()的结果集
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。