您的位置：首页 > 其它

ELK合集持续更新(十一):Elasticsearch关键术语之排序

2020-03-28 19:58 351 查看

Elasticsearch关键术语系列博文目的只用来了解概念 ; 其中涉及到的配置和使用是为了方便日后使用时查询的

排序

ES搜索结果的排序默认是按照文档的_score相关性算分算分高的文档优先展示搜索时可以指定根据某字段进行排序 (类似 SQL的order by)

本质

排序是针对原始内容进行的倒排索引无法发挥作用
需要用到正排索引通过文档ID和字段快速得到字段原始内容

实现排序的两种方式

方式一设置"doc_values":true 默认

本质

DocValues在索引时和倒排索引一起创建
通过序列化把数据结构持久化到磁盘我们可以充分利用操作系统的内存而不是 JVM 的 Heap
当workingset远小于系统的可用内存系统会自动将 DocValues保存在内存中使得其读写十分高速
不过当其远大于可用内存时操作系统会自动把DocValues写入磁盘
很显然这样性能会比在内存中差很多但是它的大小就不再局限于服务器的内存了如果是使用JVM的Heap来实现那么只能是因为OutOfMemory导致程序崩溃了

作用

text类型的字段不能排序
其他类型的字段都可排序聚合脚本操作
可避免大量JVM heap占用而导致内存溢出
但降低索引速度占用额外磁盘空间

设置关闭

作用

增加索引速度减少磁盘空间
但设置后的字段不能做排序聚合脚本操作

设置mapping

PUT index名/_mapping
{
"properties":{
"字段名":{
"type":"keyword",
"doc_values":false
}
}
}

设置重新打开

需要重建索引

方式二设置"fielddata":true 默认flase

本质

搜索时动态创建
创建位置 JVM heap

作用

text类型的字段可排序
索引速度快不占用额外磁盘空间
文档过多时动态创建开销大占用过多JVM heap 太多字段设置了开启容易outofmemory内存溢出

设置开启

设置mapping

PUT kibana_sample_data_ecommerce/_mapping
{
"properties":{
"customer_full_name":{
"type":"text",
"fielddata":true,
"fields":{
"keyword":{
"type":"keyword",
"ignore_above":256
}
}
}
}
}

参考
阮一名资料
官方文档
百度

点赞
收藏
分享
文章举报

hungry和她的朋友们发布了25 篇原创文章 · 获赞 0 · 访问量 356 私信关注

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

ELK合集持续更新(十一):Elasticsearch关键术语之排序

排序

本质

实现排序的两种方式

方式一 设置"doc_values":true 默认

方式二 设置"fielddata":true 默认flase

方式一设置"doc_values":true 默认

方式二设置"fielddata":true 默认flase