微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

postgresql数据库中,查询点在面内

前几日在qq群,碰到了一个关于pg查询的问题,本人想出了一些方法,记录下来,以后可能会用得到

数据基础:t_city存储城市的面数据,数据量346条,xzqhdm存储行政区划点数据,数据量:712182条

需求:查询行政区划数据中,被城市的面包含的点

第一种方法

SELECT * from xzqhdm as xz where xz.shape is not null and EXISTS (select ci.id  from t_city as ci where st_intersects(ci.geom,xz.shape) LIMIT 1) LIMIT 10000

查询10000个点用了3.7秒,当只查询点信息,这种方式是最快的(不输出面信息)

查询方式和程序中处理比较像:

外层循环取出一个值与内层循环中的值比较,有一个如何,则将外层的数据加入到一个返回变量中,最后返回这个变量

第二种

select * from xzqhdm xz left JOIN t_city as ci on st_intersects(ci.geom,xz.shape) where xz.shape is not null LIMIT 10000

查询10000 个点用了13秒,比第一种慢,但是会携带面信息

查询方式,利用左连接,将两张表以包含关系结合然会返回需要的条数

 

第三种

如果数据变化不大的情况,可以将这种关联关系事先存在一张表中,可以达到毫秒级查询速度,数据变动之后,根据变化的数据更新关系即可

 

如有更好的方法评论中留言,感谢

 

关于EXISTS 和 IN 的索引问题

in 是把外表和内表作hash join,而exists是对外表作loop,每次loop再对内表进行查询

INT 的执行过程:

在in执行的过程中,用到了外层查询上的连接字段索引,首先执行in语句,然后将结果缓存起来,之后遍历t1表,将满足结果的加入结果集,所以执行次数为t1.length*t2.length次。

EXISTS 的执行过程:

用到了内层查询上的连接字段索引,exists执行次数为t1.length,不缓存exists的结果集

具体需求,具体应用

关于NOT EXISTS 和 NOT IN的索引问题

NOT IN 的执行过程:

因为not in实质上等于!= and != ···,因为!=不会使用索引,故not in不会使用索引。

NOT EXISTS 的执行过程:

执行过程和exists一样,用到了内层查询上的关联字段索引,exists()执行次数为t1.length,不缓存exists()的结果集

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐