微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

mysqlcft 1、优点:2、缺点: MySQL全文搜索引擎

程序名称:mysqlcft 1、优点:2、缺点:

授权协议: LGPL

操作系统: Linux

开发语言: C/C++

mysqlcft 1、优点:2、缺点: 介绍

MysqL在高并发连接、数据库记录数较多的情况下,SELECT … WHERE … LIKE
‘%…%’的全文搜索方式不仅效率差,而且以通配符%开头作查询时,使用不到索引,需要全表扫描,对数据库的压力也很大。MysqL针对这一问题提供
了一种全文索引解决方案,这不仅仅提高了性能和效率(因为MysqL对这些字段做了索引来优化搜索),而且实现了更高质量的搜索。但是,至今为
止,MysqL中文全文索引无法正确支持

MysqLcft 是为 MysqL 5.1.22 ~ 5.1.25 RC 开发的中文全文索引插件,用于解决MysqL无法正确支持中文全文检索的问题。

特点:

1、优点:

  • 精准度很高:采用自创的“三字节交叉切分算法”,对中文语句进行分割,无中文分词词库,搜索精准度远比中文分词算法高,能达到LIKE ‘%…%”的准确率。
  • 查询速度快:查询速度比LIKE ‘%…%”搜索快3~50倍,文章末尾有测试结果;
  • 标准插件式:以MysqL 5.1全文索引的标准插件形式开发,不修改MysqL代码,不影响MysqL的其他功能,可快速跟进MysqL新版本;
  • 支持版本多:支持所有的MysqL 5.1 Release Candidate版本,即MysqL 5.1.22 RC~最新的MysqL 5.1.25 RC;
  • 支持字符集:支持包括GBK、GB2312、UTF-8、latin1、BIG5在内的MysqL字符集(其他字符集没有测试过);
  • 系统兼容好:具有i386和x86_64两个版本,支持32位(i386)和64位(x86_64)cpu及Linux系统;
  • 适合分布式:非常适合MysqL Slave分布式系统架构,无词库维护成本,不存在词库同步问题。

2、缺点:

  • MysqLcft中文全文索引只适用于MyISAM表,因为MysqL支持对MyISAM表建立FULLTEXT索引;
  • MysqL不能静态编译安装,否则无法安装MysqLcft插件
  • 基于“三字节交叉切分算法”的索引文件会比海量、ft-hightman等基于“中文分词算法”的索引文件稍大,但不是大很多。

根据我的测试,MysqLcft全文索引的.MYI索引文件是.MYD数据文件的2~6倍。

mysqlcft 1、优点:2、缺点: 官网

https://code.google.com/p/mysqlcft/

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐