您的位置:首页 > 其它

Es图形化软件使用之ElasticSearch-head、Kibana,Elasticsearch之-倒排索引操作、映射管理、文档增删改查

2022-05-25 19:39 609 查看

今日内容概要

  • ElasticSearch之-ElasticSearch-head
  • ElasticSearch之-安装Kibana
  • Elasticsearch之-倒排索引
  • Elasticsearch之-索引操作
  • Elasticsearch之-映射管理
  • Elasticsearch的文档增删查改(CURD)

内容详细

1、ElasticSearch之-ElasticSearch-head

# 本质都是 c s 架构的软件

# es:web服务端封装了一些restful接口   --b s架构
-docker

# mysql,redis---》自定制的 tcp 协议  --b s架构

# 服务端装好了
# 装客户端
-浏览器--->只能发get请求
-postman
-ElasticSearch-head 第三方用nodejs写的的客户端
-Kibana 官方提供的

# head的安装
# 地址:https://github.com/mobz/elasticsearch-head,可以用git下载,或者下载zip

# 解压后切换到目录下
cd elasticsearch-head-master
# 通过npm安装依赖
npm install
# 启动
npm run start
#在浏览器里打开
http://localhost:9100/

# 使用ElasticSearch-head连接服务端
-es是一个web后端
-ElasticSearch-head在跑在一个端口上,会有跨域问题
-解决跨域问题---》es的配置文件中加入允许跨域

# 跨域的配置---》es 的 config目录下的 elasticsearch.yml 添加下面两句:
http.cors.enabled: true
http.cors.allow-origin: "*"

2、ElasticSearch之-安装Kibana

# 可视化客户端---》在浏览器中访问

# 重点:
-es版本需要跟Kibana完全一一对应

# 使用步骤
-官方下载,解压
https://www.elastic.co/cn/downloads/past-releases/kibana-7-5-0

-配置Kibana---》指定连接的es服务端是什么
E:\es\kibana-7.5.0-windows-x86_64\config\kibana.yml:
server.port: 5601
server.host: "127.0.0.1"
server.name: lqz
elasticsearch.hosts: ["http://localhost:9200/"]

-启动即可
cd到 安装路径的 bin路径 启动: ./kibana

# 会在es中创建一些索引,我们不需要管,也不要删掉

# head 用来看es的数据
# kibana 增删查改数据

3、Elasticsearch之-倒排索引

# 面试es重点:倒排索引  keywords和text区别
keyword不分词,直接建索引
text要分词,再建索引

# 倒排索引:通过关键字建立索引查询文档,存的时候对关键字建立索引
文章id---》文章内容  ---》正向索引

关键词1
关键词2 ---》文章内容1,文章内容2---》倒排索引
关键词3

# 总结
- 反向索引又叫倒排索引,是根据文章内容中的关键字建立索引

- 搜索引擎原理就是建立反向索引

- Elasticsearch 在 Lucene 的基础上进行封装,实现了分布式搜索引擎

- Elasticsearch 中的索引、类型和文档的概念比较重要,类似于 MySQL 中的数据库、表和行

- Elasticsearch 也是 Master-slave 架构,也实现了数据的分片和备份

- Elasticsearch 一个典型应用就是 ELK 日志分析系统

4、Elasticsearch之-索引操作(增删改查)

# 索引对等 mysql的数据库

### 新增索引  建立一个lqz索引,有5个分片,每个分片一个副本
PUT lqz
{
"settings": {
"index":{
"number_of_shards":5,
"number_of_replicas":1
}
}
}

### 查看索引
# 获取lqz2索引的配置信息
GET lqz/_settings

# 获取所有索引的配置信息
GET _all/_settings
# 同上
GET _settings

# 获取lqz和lqz2索引的配置信息
GET lqz,lqz2/_settings

### 修改索引 (一般不改)
PUT lqz/_settings
{
"number_of_replicas": 2
}

### 删除索引
DELETE lqz

5、Elasticsearch之-映射管理

# 等同于原来 mysql中建表语句

# es 6.x之前,一个索引下可以有多个类型  --->一个库下可以有多个表
# 6.x 可以使用多个类型,但不能创建了
# es 6.x以后,一个索引下只能有一个类型  --->一个库下只能有一个表

# 在es中,索引没有,类型没有,可以直接插入文档--》插入文档后,自动创建索引和类型
# mysql必须先建库,再建表,再插入数据

##### 创建类型
# 6.x之前的建立类型
PUT books  # 给books索引,建立一个类型book类型,无论索引是否存在
{
"mappings": {
"book":{
"properties":{
"title":{
"type":"text"
},
"price":{
"type":"integer"
},
"addr":{
"type":"keyword"
},
"company":{
"properties":{
"name":{"type":"text"},
"company_addr":{"type":"text"},
"employee_count":{"type":"integer"}
}
},
"publish_date":{"type":"date","format":"yyy-MM-dd"}

}
}
}
}

#  6.x以后的建立类型-->不能建多个类型了,不需要指定类型,默认叫 _doc
PUT books
{
"mappings": {
"properties":{
"title":{
"type":"text"
},
"price":{
"type":"integer"
},
"addr":{
"type":"keyword"
},
"company":{
"properties":{
"name":{"type":"text"},
"company_addr":{"type":"text"},
"employee_count":{"type":"integer"}
}
},
"publish_date":{"type":"date","format":"yyy-MM-dd"}

}
}
}

# python 没有基础数据类型---》对象 ---》整形可以无限长
# 字段类型  字段数据类型
string类型:text,keyword
数字类型:byte(int8->一个字节),short(int16->2个字节),integer(int32->4个字节),long(int64-->8个字节),float(float32),double(float64)
日期类型:data
布尔类型:boolean
binary类型:binary
复杂类型:object(实体,对象),nested(列表)
geo类型:geo-point,geo-shape(地理位置)
专业类型:ip,competion(搜索建议)

# 字段参数\映射参数---》字段有参数
属性	描述	适合类型
store	值为yes表示存储,no表示不存储,默认为yes	all
index	yes表示分析,no表示不分析,默认为true	text
null_value	如果字段为空,可以设置一个默认值,比如"NA"(传过来为空,不能搜索,na可以搜索)	all
analyzer	可以设置索引和搜索时用的分析器,默认使用的是standard分析器,还可以使用whitespace,simple。都是英文分析器	all
include_in_all	默认es为每个文档定义一个特殊域_all,它的作用是让每个字段都被搜索到,如果想让某个字段不被搜索到,可以设置为false	all
format	时间格式字符串模式	date

###### 查看映射 mapping  类型
# 查看books索引的mapping
GET books/_mapping
# 获取所有的mapping
GET _all/_mapping

#### 插入文档
# 测试数据1
PUT books/_doc/1
{
"title":"大头儿子小偷爸爸",
"price":100,
"addr":"北京天安门",
"company":{
"name":"我爱北京天安门",
"company_addr":"我的家在东北松花江傻姑娘",
"employee_count":10
},
"publish_date":"2019-08-19"
}

# 测试数据2
PUT books/_doc/2
{
"title":"白雪公主和十个小矮人",
"price":"99",
"addr":"黑暗森里",
"company":{
"name":"我的家乡在上海",
"company_addr":"朋友一生一起走",
"employee_count":10
},
"publish_date":"2018-05-19"
}

6、Elasticsearch的文档增删查改(CURD)

### 文档增
PUT lqz/_doc/1
{
"name":"顾老二",
"age":30,
"from": "gu",
"desc": "皮肤黑、武器长、性格直",
"tags": ["黑", "长", "直"]
}

### 文档改
# 方式一:覆盖更新
PUT lqz/_doc/1
{
"name":"lqz",
"age":30,
}

# 方式二:真更新
POST lqz/_doc/1/_update
{
"doc": {
"desc": "皮肤很黄,武器很长,性格很直",
"tags": ["很黄","很长", "很直"]
}
}

POST lqz/_update/1
{
"doc": {
"desc": "xx,yy,zz",
"tags": ["很黄","很长", "很直"]
}
}

### 文档删
DELETE lqz/_doc/1

### 文档查(最复杂)
# 方式一:根据id
GET lqz/_doc/1

# 方式二:根据查询字符串
GET lqz/_search?q=from:gu
GET lqz/_search?q=age:29

# 方式三:结构化查询(常用,功能丰富)
GET lqz/_search
{
"query": {
"match": {
"name": "gu"
}
}
}

#### 面试重点:term 和 match的区别
- term代表完全匹配,不进行分词器分析
term 查询的字段需要在mapping的时候定义好,否则可能词被分词。传入指定的字符串,查不到数据

-match
match的查询词会被分词,会把要搜索的词分词---》搜索
存的时候,如果是text类型,会分词,建索引存储

# es是个存数据的地方
-mysql---》存到es
-pymysql取出mysql数据---》存到es中
-查询数据
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: