微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在postgresql中搜索不同的字符集?

我想搜索包含阿拉伯文和英文文本的postgres DB中的表格.例如:

id | content
-----------------
1  | دجاج    
2  | chicken
3  | دجاج chicken

结果会让我排第3行.

我想这与使用正则表达式限制字符有关,但我找不到一个干净的解决方案来选择它们.我试过了:

SELECT regexp_matches(content,'^([x00-\xFF]+[a-zA-Z][x00-\xFF]+)*')
FROM mg.messages;

但是,这只匹配{}中的英语和一些非英语字符.

解决方法

我一般对阿拉伯语文本或RTL语言一无所知,但这有效:

create table phrase (
  id serial,phrase text
);

insert into phrase (phrase) values ('apple pie');
insert into phrase (phrase) values ('فطيرة التفاح');

select *
from phrase
where phrase like ('apple%')
or phrase like ('فطيرة%');

http://sqlfiddle.com/#!15/75b29/2

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐