ElasticSearch 学习笔记总结(一)

news/2024/3/28 19:45:55/文章来源:https://blog.csdn.net/IT_Holmes/article/details/128933511

文章目录

  • 一、 数据的 分类
  • 二、 ElasticSearch 介绍
  • 三、 ElasticSearch 搭建
  • 四、正排索引 和 倒排索引
  • 五、ES HTTP 索引 操作
  • 六、ES HTTP 文档 操作
  • 七、ES HTTP 查询数据
    • 1. 条件查询
    • 2. 分页查询
    • 3. 排序查询
    • 4. 多条件查询
    • 5. 全文检索 完全匹配 高亮显示
    • 6. 聚合查询
  • 八、 ES HTTP 映射

一、 数据的 分类

结构化数据: 像表格、字段等都属于结构化数据,一般存储在 SQL数据库 中。缺点:一点结构固定,很难再去拓展。

非结构化数据: 像报表、图片、通讯记录、日志、视频等等都属于非结构化数据,一般存储在 NoSQL数据库 中。缺点:这些数据维度广、数据量大,对于数据存储和查询维护起来成本很大。

半结构化数据:html、xml这样的文件 属于半结构化数据。

简而言之,ElasticSearch就是用来处理这几种数据类型的。

二、 ElasticSearch 介绍

在这里插入图片描述
ES是一个开源的高扩展的分布式的全文搜索引擎。

Lucene是Apache软件基金会Jakarta项目组的一个子项目,提供了简单强大的应用程式接口,能够做全文检索和搜索,Lucene是基于java研发的,而ES就是基于Lucene的

Elasticsearch是面向文档型数据库,一条数据在这里就是一个文档。
在这里插入图片描述

使用案例:
在这里插入图片描述
在这里插入图片描述

三、 ElasticSearch 搭建

ES官方:https://www.elastic.co/cn/

下载安装,启动。
在这里插入图片描述
启动过程中,可能会遇到各种问题,常见的几个情况:

  • jdk版本低。
  • 内存空间不足,以下为解决方式。
    在这里插入图片描述
  • 再个就是不能以root用户进行登录。创建或使用其他用户,注意要赋予用户权限。

四、正排索引 和 倒排索引

两种索引类型:

  • 正排(正向)索引:
    在这里插入图片描述
  • 倒排索引。
    在这里插入图片描述

五、ES HTTP 索引 操作

创建索引:(等同于创建数据库)

  • 发送put请求。
    例如:http://127.0.0.1:9200/shopping 。
    请求后面的shopping就是索引名称。(rest风格)

在这里插入图片描述

获取索引信息:

  • 只需要将方法换成get就可以。

查询所有索引信息:

  • http://127.0.0.1:9200/_cat/indices?v (v是一个参数)

删除索引:

  • 只需要将方法换成delete就可以。

六、ES HTTP 文档 操作

幂等性操作都可以发送put请求。

幂等性: 所谓的幂等性,是分布式环境下的一个常见问题,一般是指我们在进行多次操作时,所得到的结果是一样的,即多次运算结果是一致的。

创建文档:

  • 发送Post请求:
    http://127.0.0.1:9200/shopping/_doc 。
    注意:body请求体不能为空。
  • 还可以自定义id:
    http://127.0.0.1:9200/shopping/_doc/1001
    也可以发送Put请求(幂等性)
    还可以通过_create访问:http://127.0.0.1:9200/shopping/_create/1002

查询文档:

  • 同上发送get请求:
    http://127.0.0.1:9200/shopping/_doc/1001 后面跟的是_id。

查询当前索引下的所有文档:

  • 发送get请求,访问_search路径:
    http://127.0.0.1:9200/shopping/_search

全量文档修改:(全部修改)

  • 发送put请求:(幂等性)
    http://127.0.0.1:9200/shopping/_doc/1001

局部文档修改:(局部修改)

  • 发送post请求:
    http://127.0.0.1:9200/shopping/_update/1001 (使用_update方便知道调用的局部修改。)
    在这里插入图片描述

删除文档:

  • 发送delete请求:
    http://127.0.0.1:9200/shopping/_doc/1001

七、ES HTTP 查询数据

1. 条件查询

get方法直接查询:(有点麻烦,并且参数放到url里面容易乱码)

# get方法直接查询:(有点麻烦,并且参数放到url里面容易乱码)
http://127.0.0.1:9200/shopping/_search?q=category:小米

post方法:(推荐使用)
在这里插入图片描述
直接发送match_all不传参数就可以查询全部:

{"query":{"match_all":{}}
}

2. 分页查询

只需要修改对应参数:

{"query":{"match_all":{}},"from":0, // from从第几页开始, 也就是页码"size":2, // 一页多少数据"_source":["title"] // 负责控制返回值_source(里面存着数据的属性),这样就只返回了title属性。
}

3. 排序查询

{"query":{"match_all":{}},"from":0,"size":2,"_source":["title"],"sort":{ // sort负责定义排序操作"price":{ // 指定哪个属性"order":"desc" // 排序方式}}
}

4. 多条件查询

Post请求如下:

{"query":{"bool" : {// 必须匹配的内容中的每一条。"must":[{"match":{"category":"小米"}},{"match":{"price":1999.00}}],// 符合下面其中一个即可"should":[{"match":{"category":"华为"}},{"match":{"price":1999.00}}],// 过滤相关数据"filter":[{"range":{"price":{"gt":5000}}}]}}
}

5. 全文检索 完全匹配 高亮显示

http://127.0.0.1:9200/shopping/_search

全文检索匹配:会进行分词的效果,所有包含 ’ 小 ’ 和 ’ 米 '的都进行匹配出来。

{"query" : {// 全文检索匹配"match" : {"category" : "小米"}}
}

完全匹配:完全进行匹配出来。

{"query" : {// match_phrase是完全匹配。"match_phrase" : {"category" : "小米1"}}
}

高亮显示:

{"query" : {"match_phrase" : {"category" : "小米"}},// 高亮显示效果。"highlight": {"fields" : {"category" : {}}}
}

在这里插入图片描述

6. 聚合查询

聚合查询就是 一些像求和,多少数量,平均值等一系列的情况。

{"aggs" : { // 聚合操作"price_group" : { // 名称,随意起名 求平均值用price_avg"terms" : { // 分组"field" : "price" // 分组字段}}},"size" : 0 // 如果只需要聚合数据,不需要原始数据,直接讲size设置为0就可以了。
}

八、 ES HTTP 映射

http://127.0.0.1:9200/user/_mapping

指定某些属性为特殊情况:

{"properties" : {"name" : {"type" : "text","index" : true},"sex" : {"type" : "keyword", // keyword关键字,查询就要精确查询。"index" : true},"tel" : {"type" : "keyword", // 关闭关键字就不会了。"index" : false}}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_72832.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Scalable but Wasteful: Current State of Replication in the Cloud

文章目录ABSTRACT1 INTRODUCTION2 REPLICATION IN THE WILD3 CURRENT APPROACHES TO SCALING STATE MACHINE REPLICATION4 EFFICIENCY METRIC5 INEFFECTIVENESS OF CURRENT APPROACHES PER NEW METRIC6 CONCLUSION AND FUTURE DIRECTIONSABSTRACT 共识协议是部署在基于云的存储…

面试热点题:stl中vector与list的优缺点对比、以及list的迭代器与vector迭代器的区别

vector的优点 下标随机访问 vector的底层是一段连续的物理空间,所以支持随机访问尾插尾删效率高 跟数组类似,我们能够很轻易的找到最后一个元素,并完成各种操作cpu高速缓存命中率高 因为系统在底层拿空间的时候,是拿一段进cpu&am…

Linux:基于libevent读写管道代码,改进一下上一篇变成可以接收键盘输入

对上一篇进行改进&#xff0c;变成可以接收键盘输入&#xff0c;然后写入管道&#xff1a; 读端代码&#xff1a; #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <sys/types.h> #include <sys/stat.h> #include <s…

乌卡时代的云成本管理:从0到1了解FinOps

在上一篇文章中&#xff0c;我们介绍了企业云业务的成本构成以及目前面临的成本困境&#xff0c;以及当前企业逐步转向 FinOps 的行业趋势&#xff0c;这篇文章我们将详细聊聊 FinOps&#xff0c;包括概念、重要性以及成熟度评价指标。 随着对云服务和供应商的使用越来越多&…

Sms多平台短信服务商系统~完成阿里云短信服务发送可自行配置

1.项目中引入Maven 阿里云地址 不同编程语言都有对应的SDK,你们下载自己需要的即可。 pom.xml中添加maven坐标 <!--阿里云短信服务--><dependency><groupId>com.aliyun</groupId><artifactId>alibabacloud-dysmsapi20170525</artifactId>…

【UE4 制作自己的载具】1-使用3dsmax制作载具

学习谌嘉诚课程所做笔记源视频链接&#xff1a;【虚幻4】UE4雪佛兰科迈罗汽车详细制作中文教程&#xff01;&#xff08;汽车骨骼绑定驾驶、动画蓝图&#xff09;汽车模型下载链接&#xff1a;https://pan.baidu.com/s/1ZH5gaAwckzRIZ0w6n0qvIA密码&#xff1a;19sj步骤&#x…

系列五、事务

一、事务简介 1.1、定义 事务是一组操作的集合&#xff0c;它是一个不可分割的工作单位&#xff0c;事务会把所有的操作作为一个整体一起向系 统提交或撤销操作请求&#xff0c;即这些操作要么同时成功&#xff0c;要么同时失败。 例如: 张三给李四转账1000块钱&#xff0c;张…

Codeforces Round #848 (Div. 2)(A~D)

A. Flip Flop Sum给出一个只有1和-1的数组&#xff0c;修改一对相邻的数&#xff0c;将它们变为对应的相反数&#xff0c;修改完后数组的和最大是多少。思路&#xff1a;最优的情况是修改一对-1&#xff0c;其次是一个1一个-1&#xff0c;否则修改两个1。AC Code&#xff1a;#i…

2023-02-22 学习记录--TS-邂逅TS(二)

TS-邂逅TS&#xff08;二&#xff09; 不积跬步&#xff0c;无以至千里&#xff1b;不积小流&#xff0c;无以成江海。&#x1f4aa;&#x1f3fb; 一、接口&#xff08;interface&#xff09; 在 ts 中&#xff0c;子类只能继承一个父类&#xff0c;不可多继承&#xff0c;但是…

学习国家颁布的三部信息安全领域法律,理解当前工作中的信息安全合规要求

目录三部信息安全领域的法律文件三部法律的角色定位与联系三部法律的适用范围三部法律的主要履职部门三部法律条文章节结构中的共性三部法律中的一些次重点章节网络安全法的重点章节数据安全法的重点章节个人信息保护法的重点章节关于工业和信息化部行政执法项目清单三部信息安…

ChatGPT这是要抢走我的饭碗?我10年硬件设计都有点慌了

前 言 呃……问个事儿&#xff0c;听说ChatGPT能写电路设计方案了&#xff0c;能取代初级工程师了&#xff1f;那我这工程师的岗位还保得住么&#xff1f;心慌的不行&#xff0c;于是赶紧打开ChatGPT问问它。 嘿&#xff0c;还整的挺客气&#xff0c;快来看看我的职业生涯是否…

非关系型数据库(mongodb)简单使用介绍

关系型数据库与非关系型数据库 关系型数据库有mysql、oracle、db2、sql server等&#xff1b; 关系型数据库特点&#xff1a;关系紧密&#xff0c;由表组成&#xff1b; 优点&#xff1a; 易于维护&#xff0c;都是使用表结构&#xff0c;格式一致&#xff1b; sql语法通用&a…

IP地理位置定位技术原理是什么

IP地理位置定位技术的原理是基于IP地址的网络通信原理和基础上的。它利用IP地址所包含的一些信息&#xff0c;如网络前缀和地址段&#xff0c;以及ISP的IP地址归属地数据库&#xff0c;来推测IP地址所对应的地理位置。具体来说&#xff0c;IP地址是由32位二进制数字组成的&…

《计算机网络:自顶向下方法》实验2:常用网络命令的使用

使用Ping实用程序来测试计算机的网络连通性 登录到Windows中。单击开始,然后将鼠标指针移到程序上,再移到Windows系统,然后单击命令提示符。在命令提示窗口键入ping 127.0.0.1。问题1:发送了多少数据包?接受了多少数据包?丢失了多少数据包? 发送了4个数据包;接受了4个数…

Java集合(二)---Map

1.什么是Hash算法哈希算法是指把任意长度的二进制映射为固定长度的较小的二进制值&#xff0c;这个较小的二进制值叫做哈希值static final int hash(Object key) {int h;return (key null) ? 0 : (h key.hashCode()) ^ (h >>> 16);}以上是HashMap中的hash算法代码2…

机器学习------ 基于ubuntu 22.04 系统下的pytorch 安装记录过程(包含cuda和cudnn的安装)

机器学习----- pytorch的安装过程 最近&#xff0c;在学习机器学习&#xff0c;在对于理论方面进行一段时间的学习后&#xff0c;打算开始上手代码。在此之前&#xff0c;选择了pytorch作为学习的工具&#xff0c;这里记录下安装的过程。在这里&#xff0c;先把我的设备展示一…

java10-异常处理

1.异常处理体系结构 2.从程序执行过程看编译时异常和运行时异常 》编译时异常&#xff1a;执行javac.exe命令时&#xff0c;可能出现的异常 》运行时异常&#xff1a;执行java.exe命令时&#xff0c;出现的异常 3.常见的异常类型&#xff0c;请举例说明&#xff1a; Test …

PCL 平面拟合方法 对比

目录 一、最小二乘法 (Least Squares, LS) 二、采样一致性&#xff08;Sample Consensus&#xff09;方法 2.1 pcl::LeastMedianSquares (LMedS) 2.2 pcl::RandomSampleConsensus (RANSAC) 2.3 pcl::MEstimatorSampleConsensus (MSAC) 2.4 pcl::RandomizedRandomSampleCo…

解决Ubuntu22.04.1上安装ch34x串口驱动报 Key was rejected by service 需要签名的问题

解决Ubuntu22.04.1上安装ch34x串口驱动报 Key was rejected by service 需要签名的问题问题官网下载解压驱动包编译安装给驱动签名再来载入模块&#xff08;设备驱动程序&#xff09;问题 Ubuntu22.04.1 Linux版本5.19.0-32-generic 运行Qt串口通信 m_serialPort->open(QIO…

数组类模板

要求&#xff1a;设计一个数组模板类&#xff08;MyArray&#xff09;&#xff0c;完成对不同类型元素的管理操作步骤设计头文件在 qtcreate下先创建03_code的项目&#xff0c;然后右键点击03_code添加新文件&#xff0c;点击头文件&#xff0c;点击Choose命名为 myarry.hpp&am…