您的位置:首页 > 产品设计 > UI/UE

Elasticsearch的查询器query与过滤器filter的区别

2016-09-07 19:30 716 查看
1.过滤器(filter)

通常用于过滤文档的范围,比如某个字段是否属于某个类型,或者是属于哪个时间区间。例如:1)创建日期是否在2014-2015年间 ; 2)status字段是否为succes; 3)lat_lon字段是否在某个坐标的10公里范围内?

查询示例:

<pre class="prettyprint xml">{
"size": 0,
"filter": {
"bool": {
"must": [
{
"terms": {
"keyword": [
"手机",
"iphone"
]
}
},
{
"range": {
"cdate": {
"gt": "2015-11-09T11:00:00"
}
}
}
]
}
}
}




2.查询器(query)

query的使用方法像极了filter,但query更倾向于更准确的查找。例如:1)与full text search的匹配度最高  2)正则匹配  3)包含run单词,如果包含这些单词:runs、running、jog、sprint,也被视为包含run单词 4)包含quick、brown、fox。这些词越接近,这份文档的相关性就越高

查询器会计算出每份文档对于某次查询有多相关(relevant),然后分配文档一个相关性分数:_score。而这个分数会被用来对匹配了的文档进行相关性排序。相关性概念十分适合全文搜索(full-text search),这个很难能给出完整、“正确”答案的领域。

查询示例:

{
"size": 1,
"query": {
"bool": {
"must": [
{
"terms": {
"keyword": [
"手机",
"iphone"
]
}
},
{
"range": {
"cdate": {
"gt": "2015-11-09T11:00:00"
}
}
}
]
}
}
}


3.性能区别

filter是不计算相关性的,同时可以cache。因此,filter速度要快于query。

4.两者结合

使用query和filter查询的话,需要使用 {query:{filtered:{}}} 来包含这两个查询语法。他们的好处是,借助于filter的速度可以快速过滤出文档,然后再由query根据条件来匹配。

示例如下:

{   "size":0,
"query": {
"filtered": {
"query": {
"bool": {
"should": [],
"must_not": [

],
"must": [
{
"term": {

"channel_name":"微信自媒体微信"
}
}

]
}
}

},
"filter":{
"range": {
"idate": {
"gte": "2015-09-01T00:00:00",
"lte": "2015-09-10T00:00:00"

}
}
}
}
}


我们这业务上关于elasticsearch的查询语法基本都是用query filtered方式进行的,我也推荐大家直接用这样的方法。should ,must_not, must 都是列表,列表里面可以写多个条件。 这里再啰嗦一句,如果你的查询是范围和类型比较粗大的,用filter ! 如果是那种精准的,就用query来查询。

{

”bool”:{

”should”:[],   #相当于OR条件

”must_not”:[],  #必须匹配的条件,这里的条件都会被反义

”must”:[]        #必须要有的

}

}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  elasticsearch query filter