微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

为什么这个PostgreSQL全文搜索会在不同的(RDS)服务器上中断?

在多个开发服务器上,此查询已返回预期记录:
SELECT name,name_tsv FROM vision 
WHERE name_tsv @@ plainto_tsquery('Washington Square Park');

name_tsv最初是在我的开发服务器上填充的

UPDATE vision SET name_tsv=to_tsvector(name);

并通过触发器保持最新状态.

我在AWS Postgresql RDS实例上创建了相同的数据库. dev和RDS postgres版本均为9.3.1.据我所知,每个pg_catalog都有相同的FTS配置,字典,解析器和模板(认情况下;我没有在这里搞乱任何东西).当然,我无法访问RDS实例上的pg conf文件.在此RDS实例上,上面的查询返回0条记录.

我在两个上运行了这个诊断查询

SELECT name,name_tsv,to_tsvector(name),plainto_tsquery('Washington Square Park'),name_tsv @@ plainto_tsquery('Washington Square Park') AS matches_stored_name,to_tsvector(name) @@ plainto_tsquery('Washington Square Park') AS matches_fresh_tsvector
FROM vision WHERE id_vision = 2977;

RDS实例的结果是:

"1609: Washington Square Park";"'1609':1 'park':4 'squar':3 'washington':2";"'1609':1 'park':4 'square':3 'washington':2";"'washington' & 'square' & 'park'";f;t

dev实例的结果是:

"1609: Washington Square Park";"'1609':1 'park':4 'squar':3 'washington':2";"'1609':1 'park':4 'squar':3 'washington':2";"'washington' & 'squar' & 'park'";t;t

从上面可以看出,在RDS上,to_tsvector()和plainto_tsquery()似乎都不会产生他们在开发服务器上执行的截断的lexeme’quarar'(与其他字符串相同的no-lexeme模式).但是,我试过跑步

UPDATE vision SET name_tsv=to_tsvector(name);

在RDS服务器上,但name_tsv没有改变(仍=“’1609’:1’停车’:4’小方’:3’华盛顿’:2”).

我可以在新的RDS服务器上做什么来使第一个查询以与在我的开发服务器上相同的方式返回预期记录?我想我只需要让plainto_tsquery(‘华盛顿广场公园’)将标记规范化为lexemes(例如返回’squar’而不是’square’),但我不知道从this如何做到这一点.

这个查询
SELECT name,name_tsv FROM vision 
WHERE name_tsv @@ plainto_tsquery('Washington Square Park');

使用认字典.我会说两台机器的认字典不同.看到:

regress=> SELECT plainto_tsquery('Washington Square Park');
         plainto_tsquery         
---------------------------------
 'washington' & 'squar' & 'park'
(1 row)

regress=> SELECT plainto_tsquery('english','Washington Square Park');
         plainto_tsquery         
---------------------------------
 'washington' & 'squar' & 'park'
(1 row)

regress=> SELECT plainto_tsquery('simple','Washington Square Park');
         plainto_tsquery          
----------------------------------
 'washington' & 'square' & 'park'
(1 row)

比较运行结果:

SHOW default_text_search_config ;

在两台机器上. Betcha他们是不同的.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐