Bootstrap

ElasticSearch+Kibana通过Docker部署到Linux服务器中

1、ElasticSearch概念

Elasticsearch 是一个基于 Lucene 构建的开源搜索引擎,它提供了一个分布式、RESTful 风格的搜索和数据分析引擎。Elasticsearch 能够对大量数据进行快速全文搜索,并且具有非常好的水平扩展能力,这意味着当你需要处理更多数据时,可以通过增加更多的服务器来提升性能。

文档和字段:elasticsearch是面向文档(Document)存储的,可以是数据库中的一条商品数据,一个订单信息。文档数据会被序列化为json格式后存储在elasticsearch中,原本数据库中的一行数据就是ES中的一个JSON文档;而数据库中每行数据都包含很多列,这些列就转换为JSON文档中的字段(Field);

索引和映射:将类型相同的文档集中在一起管理,称为索引(Index),我们可以把索引当做是数据库中的表;

数据库的表会有约束信息,用来定义表的结构、字段的名称、类型等信息。因此,索引库中就有映射(mapping),是索引中文档的字段约束信息,类似表的结构约束。

2、ElasticSearch、Kibana和IK分词器部署

1.1、安装ElasticSearch(版本:7.12.1)

1、在虚拟机中找到一个用于存放所有镜像的文件夹位置,进入到选中的文件夹层级拉取镜像到本地服务器;(推荐root~)

docker pull elasticsearch:7.12.1

2、通过下面的Docker命令安装单机版的ElasticSearch;

docker run -d \
  --name es \
  -e "ES_JAVA_OPTS=-Xms512m -Xmx512m" \
  -e "discovery.type=single-node" \
  -v es-data:/usr/share/elasticsearch/data \
  -v es-plugins:/usr/share/elasticsearch/plugins \
  --privileged \
  --network hm-net \
  -p 9200:9200 \
  -p 9300:9300 \
  elasticsearch:7.12.1
注释:
  • docker run:运行一个新的容器。
  • -d:以“后台模式”(detached mode)运行容器。
  • --name es:为容器指定一个名称,这里命名为es
  • -e:设置环境变量。
  • ES_JAVA_OPTS=-Xms512m -Xmx512m:为 ElasticSearch 的 JVM 设置堆内存大小。
  • discovery.type=single-node:将 ElasticSearch 配置为单节点模式,适合开发或测试环境,避免集群配置的复杂性。
  • -v:挂载数据卷。
  • es-data:/usr/share/elasticsearch/data:将主机的 es-data 数据卷挂载到容器内的 /usr/share/elasticsearch/data 目录。
  • es-plugins:/usr/share/elasticsearch/plugins:将主机的 es-plugins 数据卷挂载到容器内的 /usr/share/elasticsearch/plugins 目录。
  • --privileged:赋予容器特权模式。
  • --network hm-net:将容器连接到名为 hm-net 的 Docker 网络。
  • -p:映射端口。
  • 9200:9200:将主机的 9200 端口映射到容器的 9200 端口。
  • 9300:9300:将主机的 9300 端口映射到容器的 9300 端口。
  • elasticsearch:7.12.1:指定要运行的镜像名称和版本。这里使用的是 ElasticSearch 的 7.12.1 版本。

3、验证ElasticSearch是否运行;

# 检查容器是否正常运行
docker ps

# 查看容器运行日志文件(-f 实时查看)
docker logs -f es

4、最后可以访问ElasticSearch的接口:http://localhost:9200,返回如下内容表示成功启动了;

{
  "name" : "node-1",
  "cluster_name" : "docker-cluster",
  "cluster_uuid" : "abc123",
  "version" : {
    "number" : "8.10.0",
    "build_flavor" : "default",
    "build_type" : "docker",
    "build_hash" : "abc123",
    "build_date" : "2023-10-01T00:00:00.000Z",
    "build_snapshot" : false,
    "lucene_version" : "9.7.0",
    "minimum_wire_compatibility_version" : "7.17.0",
    "minimum_index_compatibility_version" : "7.0.0"
  },
  "tagline" : "You Know, for Search"
}

注:8以上版本的JavaAPI变化很大,有需要的自行研究;

1.2、安装Kibana(ElasticSearch官方提供的可视化工具)

1、通过下面的Docker命令拉取Kibana镜像(注:Kibana的版本号要和ElasticSearch一致,后面提到的ik分词器也是一样)

docker pull kibana:7.12.1

2、通过下面的docker命令部署Kibana工具

docker run -d \
--name kibana \
-e ELASTICSEARCH_HOSTS=http://es:9200 \
--network=hm-net \
-p 5601:5601  \
kibana:7.12.1

3、检查完成后,访问5601端口即可

  • 选择Explore on my own之后,进入主页面;
  • 然后选中Dev tools,进入开发工具页面;
1.3、安装IK分词器(版本保持一致)

方法一、在线安装

执行以下命令:

docker exec -it es ./bin/elasticsearch-plugin  install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip

重启es容器:

docker restart es

方法二、离线安装(网速差的情况)

先查看之前安装的ElasticSearch容器的plugins数据卷目录:

docker volume inspect es-plugins

结果如下:

[
    {
        "CreatedAt": "2024-11-06T10:06:34+08:00",
        "Driver": "local",
        "Labels": null,
        "Mountpoint": "/var/lib/docker/volumes/es-plugins/_data",
        "Name": "es-plugins",
        "Options": null,
        "Scope": "local"
    }
]

可以看到elasticsearch的插件挂载到了/var/lib/docker/volumes/es-plugins/_data这个目录,我们需要把IK分词器上传至这个目录。

这里的ik分词器需要自己找,直接将ik分词器上传到/var/lib/docker/volumes/es-plugins/_data这个目录下;

最后重启es容器:

docker restart es
关于ik分词器
主要包含两种模式:
  • ik_smart:智能语义切分
  • ik_max_word:最细粒度切分
但有时ik分词器也无法做到对一些网络热词拆分,这就需要ik分词器的扩展词汇的功能;(/_data/ik/config)
注意,如果采用在线安装的通过,默认是没有config目录的,需要找网络上的资料提供的ik下的config上传至对应目录。
在IKAnalyzer.cfg.xml配置文件内容中添加:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
        <comment>IK Analyzer 扩展配置</comment>
        <!--用户可以在这里配置自己的扩展字典 *** 添加扩展词典-->
        <entry key="ext_dict">ext.dic</entry>
</properties>

在IK分词器的config目录新建一个 ext.dic,可以参考config目录下复制一个配置文件进行修改,文件中就是需要组合的词语了;

再次重启es:

docker restart es
;