微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

arrays – 规范化1维数组的数组下标,使它们从1开始

Postgresql可以在任何地方开始使用数组下标.
考虑这个创建一个包含3个元素的数组的示例,其中包含5到7的下标:
SELECT ('[5:7]={1,2,3}'::int[]);

返回:

[5:7]={1,3}

例如,你得到第一个元素的含义

SELECT ('[5:7]={1,3}'::int[])[5];

我想规范化任何给定的1维数组以从数组下标1开始.
我能想到的最好的:

SELECT ('[5:7]={1,3}'::int[])[array_lower('[5:7]={1,3}'::int[],1):array_upper('[5:7]={1,1)]

或者,同样,更容易阅读:

WITH x(a) AS (
    SELECT '[5:7]={1,3}'::int[]
    )
SELECT a[array_lower(a,1):array_upper(a,1)]
FROM   x

你知道更简单/更快或更优雅的方式吗?

基准

为了测试性能,我提出了这个快速基准测试.
表有100k行,随机长度在1和11之间的简单整数数组:

CREATE TEMP TABLE t (a int[]);
INSERT INTO t -- Now with actually varying subscripts
SELECT ('[' || g%10 || ':' || 2*(g%10) || ']={1'
            || repeat(','||g::text,g%10) || '}')::int[]
FROM   generate_series(1,100000) g;

EXPLAIN ANALYZE
SELECT 
       substring(a::text,'{.*$')::int[]       -- Total runtime: 949.304 ms
--     a[-2147483648:2147483647]               -- Total runtime: 283.877 ms
--     a[array_lower(a,1)]  -- Total runtime: 311.545 ms
FROM   t

所以,是的,@ Daniel的想法稍快一些.
@Kevin的文字转换也有效,但不会赚很多分.

还有其他想法吗?

一个更简单的方法是丑陋的,但我认为技术上正确:从数组中提取最大可能的切片,而不是具有计算边界的精确切片.
它避免了两个函数调用.

例:

select ('[5:7]={1,3}'::int[])[-2147483648:2147483647];

结果是:

  int4   
---------
 {1,3}

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐