频道导航

搜索 – 使用通配符和词干的组合

2019-12-06 HTML 前端之家

前端之家收集整理的这篇文章主要介绍了搜索 – 使用通配符和词干的组合，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我正在使用雪球分析仪来阻止多个文档的标题.一切都运作良好,但他们是一些怪癖.

例：

搜索“valv”,“valve”或“valve”会返回相同数量的结果.这是有道理的,因为雪球分析仪将所有内容减少到“valv”.

使用通配符时遇到问题.搜索“valve *”或“valve *”不会返回任何结果.搜索“valv *”按预期工作.

我理解为什么会这样,但我不知道如何解决它.

我想过编写一个存储词干和非词干标记的分析器.基本上应用两个分析器并组合两个令牌流.但我不确定这是否是一个实用的解决方案.

我还考虑过使用AnalyzingQueryParser,但我不知道如何将它应用于多字段查询.此外,使用AnalyzingQueryParser会在搜索“valve *”时返回“valve”的结果,这不是预期的行为.

是否有一种利用通配符和词干算法的“首选”方式？

解决方法

之前我用过2种不同的方法来解决这个问题

>使用两个字段,一个包含词干项,另一个包含由StandardAnalyzer生成的术语.解析搜索查询时,如果在“标准”字段中进行通配符搜索,则不使用带有词干项的字段.如果您让用户直接在Lucene的QueryParser中输入查询,则可能更难使用.
>编写自定义分析器和索引重叠标记.它基本上包括使用PositionIncrementAttribute索引原始术语和索引中相同位置的词干.您可以查看SynonymFilter以获取有关如何正确使用PositionIncrementAttribute的示例.

我更喜欢解决方案#2.

上一篇：html – 如何在css中创建一个球体？下一篇：表单 – Drupal表单：希望在页面上

猜你在找的HTML相关文章

elasticsearch扩展ik分词器词库

操作步骤 1、进入elasticsearch的plugin，进入ik。进入config。 2、在config下面建立以.di...

作者：前端之家时间：2021-02-13

echarts中legend如何换行

lengend data数据中若存在''，则表示换行，用''切割。

作者：前端之家时间：2021-02-13

Echart常用效果（一）

代码实现 option = { backgroundColor: &#39;#080b30&#39;, tooltip: { t...

作者：前端之家时间：2021-02-13

freemarker中js里面取字符串，换行导致报错的解决办法

问题原因原因在于直接在js中取的变量并复制给var变量。于是就变成这样。解决办法 var d...

作者：前端之家时间：2021-02-13

Freemarker + xml 实现Java导出word

前言最近做了一个调查问卷导出的功能，需求是将维护的题目，答案，导出成word，参考了几种...

作者：前端之家时间：2021-02-13

【前端JSP思考】JSP中#{},${}和%{}的区别

JSP中#{},${}和%{}的区别： # #{}：对语句进行预编译，此语句解析的是占位符?，可以防止SQ...

作者：前端之家时间：2021-02-10

【前端HTML】常用标签及属性

对于很多人来说，用HTML标签都是熟能生巧，而不清楚为什么是那样的标签，所以我在这列了一...

作者：前端之家时间：2021-02-10

[前端]GOFLY项目-响应式登录页的设计和实现

登录界面如果要实现响应式 , 需要注意宽度的设置和media query的使用宽度一般都是按百分比...

作者：前端之家时间：2021-02-05

[前端] 设定为disabled的表单域值不能被提交

表单中的某个表单域被设定为disabled，则该表单域的值就不会被提交。但是我们需要提交这个...

作者：前端之家时间：2021-02-05

[前端] 代码中执行绑定元素的指定事件trigger方法

前面业务里有个搜索功能 , 入口比较深 , 现在想要把入口挪到有公共header的地方 , 在不想完...

作者：前端之家时间：2021-02-05

最新文章