微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – wordnet中引理和synset之间的连接或区别是什么?

我是NLP和NLTK的初学者.

我无法理解wordnet中的lemmas和synsets之间的确切区别,因为两者产生的输出几乎相同.例如,对于单词cake,它会产生这个输出.

lemmas :  [Lemma('cake.n.01.cake'), Lemma('patty.n.01.cake'), Lemma('cake.n.03.cake'), Lemma('coat.v.03.cake')]

synsets :  [synset('cake.n.01'), synset('patty.n.01'), synset('cake.n.03'), synset('coat.v.03')]

请帮我理解这个概念.

谢谢.

解决方法:

这些术语基于“引理”和“同义词”这一词的一般含义.

引理是wordnet在字典中的条目版本:规范形式的单词,具有单一含义.例如,如果你想在字典中查找“银行”,那么规范形式将是“银行”,名词中会有单独的引理,意思是“金融机构”和“河边”,另外一个用于动词“to bank(on)”等

术语synset代表“同义词集”.一组同义词是具有相似含义的一组词,例如,船,小船,独木舟,皮划艇可能都是船的同义词.在nltk中,synset实际上是一组具有相关含义的lemmas.以你的例子(wn.synsets(“cake”)和wn.lemmas(“cake”)的结果),我们也可以写:

>>> synsets[0]
synset('cake.n.01')
>>> synsets[0].lemmas()
[Lemma('cake.n.01.cake'), Lemma('cake.n.01.bar')]

这些是构成“蛋糕”的第一个同义词组合的引理.

Wordnet提供了许多方法,允许您探索诸如上位词/下位词,使用域等关系.有关更多信息,请直接查看Wordnet文档; nltk只为它提供了一个接口.这是Wordnet glossary.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐