Solr的自动完成实现方式(第三部分:Suggester方式续)
2011-11-30 15:03
344 查看
在之前的两个部分(part1、part2)中,我们学会了如何配置和查询solr来获取自动完成的功能。今天,我们来看一下如果为suggester添加字段,以这种方式来提供自动完成的功能。
组件配置
在上一期的配置组件中添加如下的参数:
这样我们的配置就变成了:
使用这个参数,我们让suggest组件使用名叫dict.txt的文件作为solr的配置字典。
[b]handler[/b]配置
handler的配置也需要添加额外的一个参数:
完整的配置为:
这个参数告诉solr,当查询的结果数多于设定的count数时,返回点击数更多的那些。
[b]Dictionary[/b]
我们告诉solr来使用这个字段,那么这个字段长的什么样呢?下面来看一个例子:
这个字典的结果是什么样的呢?每个词组放在单独的一行中,每行以改词组的权重为结束(权重与词组之间以TAB字符分隔),这个权重就是跟spellcheck.onlyMorePopular=true 香港的参数,默认值为1.0。该字段必须以UTF-8的编码格式存储。每行前有#字符的将被忽略(注释行)。
数据
以这种方式,我们不需要数据,字段就是数据。
运行
在重新构建suggester之后,我们来看一下它的运行情况,输入命令:
得到的结果为:
结束语
跟预期一样,suggest的结果是按权重排序的。这里的大小写敏感(注意首字母).
你有什么建议呢?如果我们有一个很好的字典,这个字典的权重是基于用户的查询行为产生的,那么用户肯定会喜欢它!如果没有好的字典,还是不要用这种方式的好。
下一步
下一期,我们看一下不同方式的suggest产生的索引结构和大小。
原文URL:http://java.dzone.com/news/solr-and-autocomplete-part-3?mz=33057-solr_lucene
组件配置
在上一期的配置组件中添加如下的参数:
<str name="sourceLocation">dict.txt</str>
这样我们的配置就变成了:
<searchComponent name="suggest" class="solr.SpellCheckComponent"> <lst name="spellchecker"> <str name="name">suggest</str> <str name="classname">org.apache.solr.spelling.suggest.Suggester</str> <str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str> <str name="field">name_autocomplete</str> <str name="sourceLocation">dict.txt</str> </lst> </searchComponent>
使用这个参数,我们让suggest组件使用名叫dict.txt的文件作为solr的配置字典。
[b]handler[/b]配置
handler的配置也需要添加额外的一个参数:
<str name="spellcheck.onlyMorePopular">true</str>
完整的配置为:
<requestHandler name="/suggest" class="org.apache.solr.handler.component.SearchComponent"> <lst name="defaults"> <str name="spellcheck">true</str> <str name="spellcheck.dictionary">suggest</str> <str name="spellcheck.count">10</str> <str name="spellcheck.onlyMorePopular">true</str> </lst> <arr name="components"> <str>suggest</str> </arr> </requestHandler>
这个参数告诉solr,当查询的结果数多于设定的count数时,返回点击数更多的那些。
[b]Dictionary[/b]
我们告诉solr来使用这个字段,那么这个字段长的什么样呢?下面来看一个例子:
# sample dict Hard disk hitachi Hard disk wd 2.0 Hard disk jjdd 3.0
这个字典的结果是什么样的呢?每个词组放在单独的一行中,每行以改词组的权重为结束(权重与词组之间以TAB字符分隔),这个权重就是跟spellcheck.onlyMorePopular=true 香港的参数,默认值为1.0。该字段必须以UTF-8的编码格式存储。每行前有#字符的将被忽略(注释行)。
数据
以这种方式,我们不需要数据,字段就是数据。
运行
在重新构建suggester之后,我们来看一下它的运行情况,输入命令:
/suggest?q=Har
得到的结果为:
<?xml version="1.0" encoding="UTF-8"?> <response> <lst name="responseHeader"> <int name="status">0</int> <int name="QTime">0</int> </lst> <lst name="spellcheck"> <lst name="suggestions"> <lst name="Dys"> <int name="numFound">3</int> <int name="startOffset">0</int> <int name="endOffset">3</int> <arr name="suggestion"> <str>Hard disk jjdd</str> <str>Hard disk wd</str> <str>Hard disk hitachi</str> </arr> </lst> </lst> </lst> </response>
结束语
跟预期一样,suggest的结果是按权重排序的。这里的大小写敏感(注意首字母).
你有什么建议呢?如果我们有一个很好的字典,这个字典的权重是基于用户的查询行为产生的,那么用户肯定会喜欢它!如果没有好的字典,还是不要用这种方式的好。
下一步
下一期,我们看一下不同方式的suggest产生的索引结构和大小。
原文URL:http://java.dzone.com/news/solr-and-autocomplete-part-3?mz=33057-solr_lucene
相关文章推荐
- 转载:Solr的自动完成实现方式(第三部分:Suggester方式续)
- 转载:Solr的自动完成实现方式(第二部分:Suggester方式)
- Solr的自动完成实现方式(第二部分:Suggester方式)
- Solr的自动完成实现方式(第一部分:facet方式)
- 转载:Solr的自动完成实现方式(第一部分:facet方式)
- Solr的自动完成/自动补充实现介绍(2):autoComplete
- solr入门之拼音加汉字方式的搜索建议自动补全的不高效实现
- solr入门之拼音加汉字方式的搜索建议自动补全的不高效实现
- (转)使用一个下拉框或文本框+列表框的方式实现类似IE地址栏自动完成的功能
- Solr的自动完成/自动补充实现介绍(1): autoComplete
- Solr的自动完成/自动补充实现介绍(3)
- 用AJAX实现google输入自动完成的简单模拟
- Javascript实现页面加载完成后自动刷新一遍清除缓存文件
- vim中实现javascript代码自动完成功能
- Mysql转Postgresql时,实现自动增长的方式
- ajax实现搜索关键词自动完成功能
- phpstorm安装laravel-ide-helper实现自动完成、代码提示和跟踪
- 第三部分:IDataObject实现
- GridView自动增加序号(三种实现方式)
- 用js实现输入提示(自动完成)