微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

GoJieba Go语言中文分词

程序名称:GoJieba

授权协议: MIT

操作系统: 跨平台

开发语言: Google Go

GoJieba 介绍

GoJieba 是 Jieba 分词 (结巴中文分词)的 Golang 语言版本分词库。

用法

go get github.com/yanyiwu/gojieba

示例代码请见 example/demo.go

cd example
go run demo.go

之所以需要先 cd 到 example 目录下,是因为 demo.go 里面有写死的字典相对路径。

输出结果:

全模式: 我/来到/北京/清华/清华大学/华大/大学
精确模式: 我/来到/北京/清华大学
新词识别: 他/来到/了/网易/杭研/大厦
搜索引擎模式: 小明/硕士/毕业/于/中国/中国科学院/科学/科学院/学院/计算所/,/后/在/日本/日本京都大学/京都/京都大学/大学/深造

性能测试

性能不错,因为 GoJieba 本身就是封装了 C++ 版本的
CppJieba 而成,
对比测试了一下,耗时大概是CppJieba 的 1.2 倍。 鉴于
CppJieba 性能还不错(详见jieba-performance-
comparison
), 所以 GoJieba性能还是可以的,
对于讲究性能的地方还是可以试试的。

客服

[email protected]

GoJieba 官网

https://github.com/yanyiwu/gojieba

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐