ES
1. ES的原理和基本概念
ES一般使用保存日志数据,对数据做日志做一些管理,ElasticSearch(resful风格)数据只有json类型的,
ElastricSearch和Solr都是基于Lucene的全文搜索引擎服务器
Lucene:
apache的子项目开源的全文搜索引擎工具包
倒排索引:
通过term或者说某个词记录其所在的文档的地址,来查找文档中的内容
Lucence的内部结构
索引:一个索引对应一个文件夹,文件夹里的分件构成一个Luence索引
段:一个索引可以包含多个段 段相互独立也可以合并,添加文档(doc)也会添加段
文档:文档是Lucence最小的单位,不同的文档存在不同的段中,每个段可以存多个文档
域(字段):一篇文档中有多个字段,可以存在不同的域中
词:是索引最小的单位,经过词法分析或者语言处理后的字符串
索引(index) -----> 数据库
类型(type)-----> 表
文档(doc)-----> 行
字段(fields)-----> 列
term (项) -----> 里面的某个字符
分词:ik分词器
对于一些没有意义的词不建立索引,不使用,不与doc文档地址链接
keyword 不进行分词不做拆分,直接根据字符串的内容建立反向索引
text 进行分词 根据分词建立反向索引
Elasticsearch分布式
分布式节点是对等,选出一个Master然后Master负责进行写入和更新操作,而且Elasticsearch会对数据进行切分,同每个分片也会保存多个副本保证高可可用
只有建立索引和类型需要经过master
数据的写入有一简单的路由规则,可以route到集群的任意节点,所以数据写入压力是分散在整个集群中的
可以做搜索和日志分析加上kibana
2. ES和Kibana的下载地址
参考文档链接:
ES完整使用从安装到springboot项目操作
linux 上安装es