ElasticSearch+Kibana通过Docker部署到Linux服务器中

1、ElasticSearch概念

Elasticsearch 是一个基于 Lucene 构建的开源搜索引擎，它提供了一个分布式、RESTful 风格的搜索和数据分析引擎。Elasticsearch 能够对大量数据进行快速全文搜索，并且具有非常好的水平扩展能力，这意味着当你需要处理更多数据时，可以通过增加更多的服务器来提升性能。

文档和字段：elasticsearch是面向文档（Document）存储的，可以是数据库中的一条商品数据，一个订单信息。文档数据会被序列化为json格式后存储在elasticsearch中，原本数据库中的一行数据就是ES中的一个JSON文档；而数据库中每行数据都包含很多列，这些列就转换为JSON文档中的字段（Field）；

索引和映射：将类型相同的文档集中在一起管理，称为索引（Index），我们可以把索引当做是数据库中的表；

数据库的表会有约束信息，用来定义表的结构、字段的名称、类型等信息。因此，索引库中就有映射（mapping），是索引中文档的字段约束信息，类似表的结构约束。

2、ElasticSearch、Kibana和IK分词器部署

1.1、安装ElasticSearch（版本：7.12.1）

1、在虚拟机中找到一个用于存放所有镜像的文件夹位置，进入到选中的文件夹层级拉取镜像到本地服务器；（推荐root~）

docker pull elasticsearch:7.12.1

2、通过下面的Docker命令安装单机版的ElasticSearch；

docker run -d \
  --name es \
  -e "ES_JAVA_OPTS=-Xms512m -Xmx512m" \
  -e "discovery.type=single-node" \
  -v es-data:/usr/share/elasticsearch/data \
  -v es-plugins:/usr/share/elasticsearch/plugins \
  --privileged \
  --network hm-net \
  -p 9200:9200 \
  -p 9300:9300 \
  elasticsearch:7.12.1

注释：

docker run：运行一个新的容器。
-d：以“后台模式”（detached mode）运行容器。
--name es：为容器指定一个名称，这里命名为es。
-e：设置环境变量。
ES_JAVA_OPTS=-Xms512m -Xmx512m：为 ElasticSearch 的 JVM 设置堆内存大小。
discovery.type=single-node：将 ElasticSearch 配置为单节点模式，适合开发或测试环境，避免集群配置的复杂性。
-v：挂载数据卷。
es-data:/usr/share/elasticsearch/data：将主机的 es-data 数据卷挂载到容器内的 /usr/share/elasticsearch/data 目录。
es-plugins:/usr/share/elasticsearch/plugins：将主机的 es-plugins 数据卷挂载到容器内的 /usr/share/elasticsearch/plugins 目录。
--privileged：赋予容器特权模式。
--network hm-net：将容器连接到名为 hm-net 的 Docker 网络。
-p：映射端口。
9200:9200：将主机的 9200 端口映射到容器的 9200 端口。
9300:9300：将主机的 9300 端口映射到容器的 9300 端口。
elasticsearch:7.12.1：指定要运行的镜像名称和版本。这里使用的是 ElasticSearch 的 7.12.1 版本。

3、验证ElasticSearch是否运行；

# 检查容器是否正常运行
docker ps

# 查看容器运行日志文件（-f 实时查看）
docker logs -f es

4、最后可以访问ElasticSearch的接口：http://localhost:9200，返回如下内容表示成功启动了；

{
  "name" : "node-1",
  "cluster_name" : "docker-cluster",
  "cluster_uuid" : "abc123",
  "version" : {
    "number" : "8.10.0",
    "build_flavor" : "default",
    "build_type" : "docker",
    "build_hash" : "abc123",
    "build_date" : "2023-10-01T00:00:00.000Z",
    "build_snapshot" : false,
    "lucene_version" : "9.7.0",
    "minimum_wire_compatibility_version" : "7.17.0",
    "minimum_index_compatibility_version" : "7.0.0"
  },
  "tagline" : "You Know, for Search"
}

注：8以上版本的JavaAPI变化很大，有需要的自行研究；

1.2、安装Kibana（ElasticSearch官方提供的可视化工具）

1、通过下面的Docker命令拉取Kibana镜像（注：Kibana的版本号要和ElasticSearch一致，后面提到的ik分词器也是一样）

docker pull kibana:7.12.1

2、通过下面的docker命令部署Kibana工具

docker run -d \
--name kibana \
-e ELASTICSEARCH_HOSTS=http://es:9200 \
--network=hm-net \
-p 5601:5601  \
kibana:7.12.1

3、检查完成后，访问5601端口即可

选择Explore on my own之后，进入主页面；
然后选中Dev tools，进入开发工具页面；

1.3、安装IK分词器（版本保持一致）

方法一、在线安装

执行以下命令：

docker exec -it es ./bin/elasticsearch-plugin  install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip

重启es容器：

docker restart es

方法二、离线安装（网速差的情况）

先查看之前安装的ElasticSearch容器的plugins数据卷目录：

docker volume inspect es-plugins

结果如下：

[
    {
        "CreatedAt": "2024-11-06T10:06:34+08:00",
        "Driver": "local",
        "Labels": null,
        "Mountpoint": "/var/lib/docker/volumes/es-plugins/_data",
        "Name": "es-plugins",
        "Options": null,
        "Scope": "local"
    }
]

可以看到elasticsearch的插件挂载到了/var/lib/docker/volumes/es-plugins/_data这个目录，我们需要把IK分词器上传至这个目录。

这里的ik分词器需要自己找，直接将ik分词器上传到/var/lib/docker/volumes/es-plugins/_data这个目录下；

最后重启es容器：

docker restart es

关于ik分词器

主要包含两种模式：

ik_smart：智能语义切分
ik_max_word：最细粒度切分

但有时ik分词器也无法做到对一些网络热词拆分，这就需要ik分词器的扩展词汇的功能；（/_data/ik/config）

注意，如果采用在线安装的通过，默认是没有config目录的，需要找网络上的资料提供的ik下的config上传至对应目录。

在IKAnalyzer.cfg.xml配置文件内容中添加：

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
        <comment>IK Analyzer 扩展配置</comment>
        <!--用户可以在这里配置自己的扩展字典 *** 添加扩展词典-->
        <entry key="ext_dict">ext.dic</entry>
</properties>

在IK分词器的config目录新建一个 ext.dic，可以参考config目录下复制一个配置文件进行修改，文件中就是需要组合的词语了；

再次重启es：

docker restart es