微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

c# – 从Lucene查询中获取查询词以突出显示

我的Lucene查询通常会存在一堆AND组合字段.
是否可以再次从查询对象中获取查询的字段?

解决方法

您的意思是提取术语或字段名称?由于您已经知道正在处理BooleanQuery,因此要提取字段,您可以简单地迭代BooleanQuery.getClauses()返回的BooleanClause数组,将每个子句重写为其基本查询(Query.rewrite)并递归应用,直到您拥有TermQuery在你的手上.

如果你的意思是术语提取,我不确定Lucene.NET,但在Java Lucene中你可以使用org.apache.lucene.search.highlight.QueryTermExtractor;你将一个(重写的)查询传递给它的一个getTerms重载并得到一个WeightedTerms数组.

据我记忆,使用这种技术的缺点是:

>由于它在内部使用术语集,因此它不会处理同一令牌的多个实例,例如“梦中的梦想”
>它仅支持基本查询类型(TermQuery,BooleanQuery和支持Query.extractTerms的任何其他查询类型).我相信我们已经在内部使用了SpanNearQuery和SpanNearOrderedQuery实例,但我可能错了.

无论哪种方式,我希望这足以让你开始.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐