我正在构建一个包含我的数据库中的世界语单词的小应用程序,所以我有像ĉapelojn和brakhorloĝo这样的词,带有“特殊”字符.
使用Postgresql 9.4.4我有一个带有以下模式的单词表:
lingvoj_dev=# \d words Table "public.words" Column | Type | Modifiers -------------+-----------------------------+---------------------------------------------------- id | integer | not null default nextval('words_id_seq'::regclass) translated | character varying(255) | meaning | character varying(255) | times_seen | integer | inserted_at | timestamp without time zone | not null updated_at | timestamp without time zone | not null Indexes: "words_pkey" PRIMARY KEY,btree (id)
lingvoj_dev=# SELECT w."translated" FROM "words" AS w ORDER BY w."translated" desc limit 10; translated ------------ ĉu ŝi ĝi ĉevaloj ĉapelojn ĉapeloj ĉambro vostojn volas viro (10 rows)
排序是不一致的 – 我可以使用以特殊字符开头的所有单词,但是所有以ĉ开头的单词应该组合在一起,而不是!为什么ŝi和ĝi介于ĉu和ĉevaloj之间?
服务器编码为UTF8,排序规则为en_AU.UTF-8.
编辑:看起来它将所有特殊字符排序为等效字符 – 它根据每个单词中的第二个字符正确排序.如何使Postgresql看到ĉ,ŝ和ĝ不等同?
I’d be okay with all of the words starting with special characters
being at the end…
使用整理“C”:
SELECT w."translated" FROM "words" AS w ORDER BY w."translated" collate "C" desc limit 10;
另见Different behaviour in “order by” clause: Oracle vs. PostgreSQL
使用ORM查询可能会有问题.解决方案可以是使用选项LC_COLLATE = C(在注释中建议的OP)重新创建数据库.还有一个选项 – 更改单个列的排序规则:
ALTER TABLE "words" ALTER COLUMN "translated" TYPE text COLLATE "C";
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。