您的位置：首页 > 其它

ELK合集持续更新(十二):Elasticsearch关键术语之分布式搜索

2020-03-28 19:57 288 查看

Elasticsearch关键术语系列博文目的只用来了解概念 ; 其中涉及到的配置和使用是为了方便日后使用时查询的

分布式搜索

例如 3个节点的es集群有3个主分片 1个副本节点收到请求后会以coordinating node的身份在6个主副分片中随机选择3个分片发送查询请求

被选中的分片执行查询进行排序然后每个分片都会返回from+size个排序后的文档id和排序值给coordinating节点

coordinating node会将query阶段从每个分片获取的排序后的文档id列表重新排序选取from到from+size个的文档的id

以multi get请求的方式到响应的分片获取详细的文档数据

问题

因为每个分片上需要查的文档个数 = from + size 所以最终协调节点需要处理number_of_shard*(from+size)个文档个数深度分页就是痛点了

示例 : 当一个查询 from=990 size=10 ES会在每个分片上都先取1000个文档然后通过coordinating node聚合所有结果最后再通过排序选取前1000个文档展示990到1000这10条数据页数越深占用内存越多

解决

搜索语句使用 “search_after”:[13,“xsdafvwrevwerbvtwer”] 避免深度分页性能问题作用实时获取下一页文档信息不能指定from 只能往下翻

原理

通过唯一排序值定位

解决

参考
阮一名资料
官方文档
百度

hungry和她的朋友们发布了25 篇原创文章 · 获赞 0 · 访问量 355 私信关注

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航