我在postgres中使用trigrams进行全文搜索,如下所示:
SELECT * FROM "Users" users WHERE 'search_text' % ANY(regexp_split_to_array(users.name,E'\\s+'))
上面的查询检查search_text是否匹配User.displayName中的任何单词(由空格分割).这可行,但结果不按实际“得分”排序.
分数可以通过相似性(文本,文本)函数来计算.
问题是我必须按顺序排序User.name中每个单词的所有相似之处.因此,如果用户名是“A B C”,则其分数应为:
similarity('search_text','A') + similarity('search_text','B') + similarity('search_text','C')
所以我需要将用户名字映射到分数,然后对它们求和(减少).我怎样才能在postgres中做到这一点?
解决方法
而不是拆分为分裂为集合的数组,然后重新组合相似性的总和
with users as ( select user_id,name from (values (1,'John Smith')) t(user_id,name) ) select user_id,sum(similarity('smth',name_part)) from ( select user_id,regexp_split_to_table(name,E'\\s+') as name_part from users ) users where 'smth' % name_part group by user_id order by 2 desc ; user_id | sum ---------+------- 1 | 0.375
我不确定你想要消除相似度低于阈值的那些名称部分.如果不是省略where子句
顺便说一下,你为什么需要拆分这个名字?为什么不将整个名称与搜索字符串进行比较?
with users as ( select user_id,name) ) select similarity('jon smth',name),* from users order by 1 desc ; similarity | user_id | name ------------+---------+------------ 0.333333 | 1 | John Smith
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。