1、ElasticSearch概念
Elasticsearch 是一个基于 Lucene 构建的开源搜索引擎,它提供了一个分布式、RESTful 风格的搜索和数据分析引擎。Elasticsearch 能够对大量数据进行快速全文搜索,并且具有非常好的水平扩展能力,这意味着当你需要处理更多数据时,可以通过增加更多的服务器来提升性能。
文档和字段:elasticsearch是面向文档(Document)存储的,可以是数据库中的一条商品数据,一个订单信息。文档数据会被序列化为json格式后存储在elasticsearch中,原本数据库中的一行数据就是ES中的一个JSON文档;而数据库中每行数据都包含很多列,这些列就转换为JSON文档中的字段(Field);
索引和映射:将类型相同的文档集中在一起管理,称为索引(Index),我们可以把索引当做是数据库中的表;
数据库的表会有约束信息,用来定义表的结构、字段的名称、类型等信息。因此,索引库中就有映射(mapping),是索引中文档的字段约束信息,类似表的结构约束。
2、ElasticSearch、Kibana和IK分词器部署
1.1、安装ElasticSearch(版本:7.12.1)
1、在虚拟机中找到一个用于存放所有镜像的文件夹位置,进入到选中的文件夹层级拉取镜像到本地服务器;(推荐root~)
docker pull elasticsearch:7.12.1
2、通过下面的Docker命令安装单机版的ElasticSearch;
docker run -d \
--name es \
-e "ES_JAVA_OPTS=-Xms512m -Xmx512m" \
-e "discovery.type=single-node" \
-v es-data:/usr/share/elasticsearch/data \
-v es-plugins:/usr/share/elasticsearch/plugins \
--privileged \
--network hm-net \
-p 9200:9200 \
-p 9300:9300 \
elasticsearch:7.12.1
- docker run:运行一个新的容器。
- -d:以“后台模式”(detached mode)运行容器。
- --name es:为容器指定一个名称,这里命名为es。
- -e:设置环境变量。
- ES_JAVA_OPTS=-Xms512m -Xmx512m:为 ElasticSearch 的 JVM 设置堆内存大小。
- discovery.type=single-node:将 ElasticSearch 配置为单节点模式,适合开发或测试环境,避免集群配置的复杂性。
- -v:挂载数据卷。
- es-data:/usr/share/elasticsearch/data:将主机的 es-data 数据卷挂载到容器内的 /usr/share/elasticsearch/data 目录。
- es-plugins:/usr/share/elasticsearch/plugins:将主机的 es-plugins 数据卷挂载到容器内的 /usr/share/elasticsearch/plugins 目录。
- --privileged:赋予容器特权模式。
- --network hm-net:将容器连接到名为 hm-net 的 Docker 网络。
- -p:映射端口。
- 9200:9200:将主机的 9200 端口映射到容器的 9200 端口。
- 9300:9300:将主机的 9300 端口映射到容器的 9300 端口。
- elasticsearch:7.12.1:指定要运行的镜像名称和版本。这里使用的是 ElasticSearch 的 7.12.1 版本。
3、验证ElasticSearch是否运行;
# 检查容器是否正常运行
docker ps
# 查看容器运行日志文件(-f 实时查看)
docker logs -f es
4、最后可以访问ElasticSearch的接口:http://localhost:9200,返回如下内容表示成功启动了;
{
"name" : "node-1",
"cluster_name" : "docker-cluster",
"cluster_uuid" : "abc123",
"version" : {
"number" : "8.10.0",
"build_flavor" : "default",
"build_type" : "docker",
"build_hash" : "abc123",
"build_date" : "2023-10-01T00:00:00.000Z",
"build_snapshot" : false,
"lucene_version" : "9.7.0",
"minimum_wire_compatibility_version" : "7.17.0",
"minimum_index_compatibility_version" : "7.0.0"
},
"tagline" : "You Know, for Search"
}
注:8以上版本的JavaAPI变化很大,有需要的自行研究;
1.2、安装Kibana(ElasticSearch官方提供的可视化工具)
1、通过下面的Docker命令拉取Kibana镜像(注:Kibana的版本号要和ElasticSearch一致,后面提到的ik分词器也是一样)
docker pull kibana:7.12.1
2、通过下面的docker命令部署Kibana工具
docker run -d \
--name kibana \
-e ELASTICSEARCH_HOSTS=http://es:9200 \
--network=hm-net \
-p 5601:5601 \
kibana:7.12.1
3、检查完成后,访问5601端口即可
- 选择Explore on my own之后,进入主页面;
- 然后选中Dev tools,进入开发工具页面;
1.3、安装IK分词器(版本保持一致)
方法一、在线安装
执行以下命令:
docker exec -it es ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip
重启es容器:
docker restart es
方法二、离线安装(网速差的情况)
先查看之前安装的ElasticSearch容器的plugins数据卷目录:
docker volume inspect es-plugins
结果如下:
[
{
"CreatedAt": "2024-11-06T10:06:34+08:00",
"Driver": "local",
"Labels": null,
"Mountpoint": "/var/lib/docker/volumes/es-plugins/_data",
"Name": "es-plugins",
"Options": null,
"Scope": "local"
}
]
可以看到elasticsearch的插件挂载到了/var/lib/docker/volumes/es-plugins/_data这个目录,我们需要把IK分词器上传至这个目录。
这里的ik分词器需要自己找,直接将ik分词器上传到/var/lib/docker/volumes/es-plugins/_data这个目录下;
最后重启es容器:
docker restart es
关于ik分词器
- ik_smart:智能语义切分
- ik_max_word:最细粒度切分
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 *** 添加扩展词典-->
<entry key="ext_dict">ext.dic</entry>
</properties>
在IK分词器的config目录新建一个 ext.dic,可以参考config目录下复制一个配置文件进行修改,文件中就是需要组合的词语了;
再次重启es:
docker restart es