docker存储卷
COW机制
——针对随时变化的数据进行备份
Ø 直接映射原始盘的数据内容
Ø 当原始盘的旧数据有修改时,在修改之前自动将旧数据存入前端盘
Ø 对前端盘的修改不回写到原始盘
前端盘:永远显示在制作出前端盘那一瞬间原始盘所有数据内容
- Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。
- 我们可以看到镜像在启动容器时,在最上面加了一层读写层,我们在修改容器里的内容时,会先从镜像(只读层)里要写的内容复制到容器的文件系统(读写层)里,并将原来的文件(只读)隐藏起来。
- 如果容器被删除了,读写层就丢失了,改动也丢失了,再使用镜像启动容器时,依然是未改动过的容器。
对于这种方式来说,我们去访问一个文件,修改和删除等一类的操作,其效率会非常的低,因为隔着很多层镜像。
而要想绕过这种限制,我们可以通过使用存储卷的机制来实现。
存储卷的概念
存储卷就是将宿主机的本地文件系统中存在的某个目录直接与容器内部的文件系统上的某一目录建立绑定关系。这就意味着,当我们在容器中的这个目录下写入数据时,容器会将其内容直接写入到宿主机上与此容器建立了绑定关系的目录。
在宿主机上的这个与容器形成绑定关系的目录被称作存储卷。
使用存储卷的好处
如果容器中跑的进程的所有有效数据都保存在存储卷中,从而脱离容器自身文件系统之后,带来的好处是当容器关闭甚至被删除时,只要不删除与此容器绑定的在宿主机上的这个存储目录,我们就不用担心数据丢失了。因此就可以实现数据持久,脱离容器的生命周期而持久。
我们通过这种方式管理容器,容器就可以脱离主机的限制,可以在任意一台部署了docker的主机上跑容器,而其数据则可以置于一个共享存储文件系统上,比如nfs。
Docker的存储卷默认情况下是使用其所在的宿主机上的本地文件系统目录的,也就是说宿主机上有一块属于自己的硬盘,这个硬盘并没有共享给其他的Docker主机,而在这台主机上启动的容器所使用的存储卷是关联到此宿主机硬盘上的某个目录之上。
这就意味着容器在这台主机上停止运行或者被删除了再重建,只要关联到硬盘上的这个目录下,那么其数据还存在。但如果在另一台主机上启动一个新容器,那么数据就没了。而如果在创建容器的时候我们手动的将容器的数据挂载到一台nfs服务器上,那么这个问题就不再是问题了。
为什么要用存储卷
关闭并重启容器,其数据不受影响,但删除Docker容器,则其更改将会全部丢失。
因此Docker存在的问题有:
存储于联合挂载文件系统中,不易于宿主机访问
容器间数据共享不便
删除容器其数据会丢失
而要解决这些问题,解决方案就是使用存储卷。
存储卷管理方式
存储卷(Data Volume)于容器初始化时被自动创建,由base image提供的卷中的数据会于此期间完成复制。
Volume的初衷是独立于容器的生命周期实现数据持久化,因此删除容器之时既不会删除卷,也不会对未被引用的卷做垃圾回收操作。
存储卷为Docker提供了独立于容器的数据管理机制,我们可以把镜像想象成静态文件,例如“程序”,把卷类比为动态内容,例如“数据”。所以镜像可以重用,而卷则可以共享。
卷实现了“程序(镜像)”和“数据(卷)”的分离,以及“程序(镜像)”和“制作镜像的主机”的分离,用户制作镜像时无须再考虑镜像运行的容器所在的主机的环境。
存储卷的分类
- Bind mount volume(绑定挂载卷):在宿主机上的路径要人工的指定一个特定的路径,在容器中也需要指定一个特定的路径,两个已知的路径建立关联关系
- Docker-managed volume(docker管理卷): 只需要在容器内指定容器的挂载点是什么,而被绑定宿主机下的那个目录,是由容器引擎daemon自行创建一个空的目录,或者使用一个已经存在的目录,与存储卷建立存储关系,这种方式极大解脱用户在使用卷时的耦合关系,缺陷是用户无法指定那些使用目录,临时存储比较适合;
容器数据管理
用户在使用Docker的过程中,往往需要能查看容器内应用产生的数据,或者需要把容器内的数据进行备份,甚至多个容器之间进行数据的共享,这必然涉及容器的数据管理操作。
Docker-managed volume(docker管理卷)
docker run -it -v /zyy busybox
Bind mount volume(绑定挂载卷)
docker run -it -v /zyy:/zyy busybox
容器中管理数据主要有两种方式:
- 数据卷(Data Volumes)
- 数据卷容器(Data Volumes Containers)
在容器中使用数据卷
Docker-managed volume(docker管理卷)
[root@docker ~]# docker run -it -v /zyy --rm nginx /bin/bash
//容器内有zyy目录
root@4681974e44f8:/# ls
zyy
//创建两个目录
root@4681974e44f8:/# mkdir /zyy/web
root@4681974e44f8:/# mkdir zyy/web2
找到管理卷所在位置
[root@docker ~]# docker inspect 4681974e44f8
"Mounts": [
{
"Type": "volume",
"Name": "e58549525074391b5f2e59c5e966bfe0c93a049e6419de4ce91db6c5704449ac",
"Source": "/var/lib/docker/volumes/e58549525074391b5f2e59c5e966bfe0c93a049e6419de4ce91db6c5704449ac/_data",
"Destination": "/zyy",
"Driver": "local",
"Mode": "",
"RW": true,
"Propagation": ""
查看
[root@docker ~]# cd /var/lib/docker/volumes/e58549525074391b5f2e59c5e966bfe0c93a049e6419de4ce91db6c5704449ac/_data/
[root@docker _data]# ls
web web2
挂载一个主机目录作为数据卷
Bind mount volume(绑定挂载卷)
//挂载本地目录,没有的话,会自行创建
[root@docker ~]# docker run -it --name web2 -v /zyy:/zyy --rm nginx /bin/bash
root@f600f81d4102:/# ls
zyy
//创建目录
root@f600f81d4102:/# mkdir /zyy/web2
root@f600f81d4102:/# ls /zyy/
web2
确实在根目录zyy下
[root@docker ~]# docker inspect web2
"Name": "overlay2"
},
"Mounts": [
{
"Type": "bind",
"Source": "/zyy",
"Destination": "/zyy",
"Mode": "",
"RW": true,
"Propagation": "rprivate"
}
],
找到目录
[root@docker ~]# ls /
zyy
[root@docker ~]# cd /zyy/
[root@docker zyy]# ls
web2
只读
[root@docker ~]# docker run -it --name web3 -v /var/www/html:/var/www/html:ro --rm nginx /bin/bash
root@4be4ab3033af:~# cd var/www/html/
root@4be4ab3033af:/var/www/html# mkdir zyy
mkdir: cannot create directory 'zyy': Read-only file system
挂载文件
[root@docker ~]# docker run -it --name web4 -v /root/.bash_history:/.bash_history --rm nginx /bin/bash
数据卷容器
如果用户需要在容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器其实就是一个普通的容器,专门用它提供数据卷供其他容器挂载使用,方法如下:
首先,创建一个数据卷容器a1,并在其中创建一个数据卷挂载到/base:
[root@docker ~]# docker run -d --name a1 -v /base nginx
然后可以在其他容器中使用–volumes-from来挂载dbdata容器中的数据卷,例如创建a2和a3两个容器,并从a1容器挂载数据卷:
[root@docker ~]# docker run -it --name a2 --volumes-from a1 --rm nginx /bin/bash
[root@docker ~]# docker run -it --name a3 --volumes-from a1 --rm nginx /bin/bash
此时,容器db1和db2都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到。
root@6302fee9c889:/# cd base/
root@6302fee9c889:/base# mkdir zyy
root@6302fee9c889:/base# ls
zyy
root@e879e3c910ca:/base# ls
zyy
可以多次使用–volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已挂载了容器卷的容器来挂载数据卷:
[root@docker ~]# docker run -d --name a4 --volumes-from a2 nginx
利用数据卷容器迁移数据
可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。
备份
使用下面的命令来备份dbdata数据卷容器内的数据卷:
[root@localhost ~]# docker run --name worker --volumes-from dbdata -v $(pwd):/backup centos tar cvf /backup/backup.tar /dbdata
恢复
如果要恢复数据到一个容器,可以按照下面的操作。首先创建一个带有数据卷的容器dbdata2:
[root@docker ~]# docker run -it --name dbdata2 -v /dbdata centos /bin/bash
然后创建另一个新的容器,挂载dbdata2容器,并使用untar解压备份文件到所挂载的容器卷中即可:
[root@docker ~]# docker run --volumes-from dbdata2 -v $(pwd):/backup busybox tar xvf /backup/backup.tar
容器数据的备份与恢复
docker cp [OPTIONS] CONTAINER:SRC_PATH DEST_PATH|-
docker cp [OPTIONS] SRC_PATH|- CONTAINER:DEST_PATH
备份
//启动一个容器,并创建一个目录
[root@docker ~]# docker run -it --rm busybox
/ # mkdir zyy
//使用docker cp
[root@docker ~]# docker cp 6f5584ea42e7:/zyy /root
[root@docker ~]# ls
zyy
恢复
//启动一个容器
[root@docker ~]# docker run -it --name a1 --rm busybox
//使用docker cp
[root@docker ~]# docker cp /root/zyy a1:/
//查看
/ # ls
zyy