微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

postgresql – 如何在Postgres中执行简单的map reduce?

我在postgres中使用trigrams进行全文搜索,如下所示:

SELECT * 
FROM "Users" users 
WHERE 'search_text' % ANY(regexp_split_to_array(users.name,E'\\s+'))

上面的查询检查search_text是否匹配User.displayName中的任何单词(由空格分割).这可行,但结果不按实际“得分”排序.

分数可以通过相似性(文本,文本)函数来计算.

问题是我必须按顺序排序User.name中每个单词的所有相似之处.因此,如果用户名是“A B C”,则其分数应为:

similarity('search_text','A') + similarity('search_text','B') + similarity('search_text','C')

所以我需要将用户名字映射到分数,然后对它们求和(减少).我怎样才能在postgres中做到这一点?

解决方法

而不是拆分为分裂为集合的数组,然后重新组合相似性的总和

with users as (
    select user_id,name
    from (values (1,'John Smith')) t(user_id,name)
)
select user_id,sum(similarity('smth',name_part))
from (
    select user_id,regexp_split_to_table(name,E'\\s+') as name_part
    from users
) users
where 'smth' % name_part
group by user_id
order by 2 desc
;
 user_id |  sum  
---------+-------
       1 | 0.375

我不确定你想要消除相似度低于阈值的那些名称部分.如果不是省略where子句

顺便说一下,你为什么需要拆分这个名字?为什么不将整个名称搜索字符串进行比较?

with users as (
    select user_id,name)
)
select similarity('jon smth',name),*
from users
order by 1 desc
;
 similarity | user_id |    name    
------------+---------+------------
   0.333333 |       1 | John Smith

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐