【编者的话】本文主要介绍了Docker Volume的原理以及使用方式,是Docker入门教程的延伸。作者通过从数据的共享、数据容器、备份、权限以及删除Volume五方面深入介绍了Volume的工作原理,从实战中帮助读者了解Volume。
【Kubernetes培训通知】DockOne将会于2018年7月13日在上海举办Kubernetes技术培训,培训内容包括:Docker介绍、Docker镜像、网络、存储、容器安全;Kubernetes架构、设计理念、常用对象、网络、存储、网络隔离、服务发现与负载均衡;Kubernetes核心组件、Pod、插件、微服务、云原生、Kubernetes Operator、集群灾备等。同时深圳站培训也已经启动,欢迎咨询。
从Docker IRC频道以及stackoverflow的问题来看,很多人还不是很明白Docker Volume的工作原理。在这篇文章中,我会尽最大的努力来解释Volume是如何工作的,并展示一些最佳实践。这篇文章主要是针对那些对Volume不了解的Docker用户,当然有经验的用户也可以通过本文了解一些Volume的细节。
想要了解Docker Volume,首先我们需要知道Docker的文件系统是如何工作的。Docker镜像是由多个文件系统(只读层)叠加而成。当我们启动一个容器的时候,Docker会加载只读镜像层并在其上(译者注:镜像栈顶部)添加一个读写层。如果运行中的容器修改了现有的一个已经存在的文件,那该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本仍然存在,只是已经被读写层中该文件的副本所隐藏。当删除Docker容器,并通过该镜像重新启动时,之前的更改将会丢失。在Docker中,只读层及在顶部的读写层的组合被称为Union File System(联合文件系统)。
为了能够保存(持久化)数据以及共享容器间的数据,Docker提出了Volume的概念。简单来说,Volume就是目录或者文件,它可以绕过默认的联合文件系统,而以正常的文件或者目录的形式存在于宿主机上。
我们可以通过两种方式来初始化Volume,这两种方式有些细小而又重要的差别。我们可以在运行时使用
【Kubernetes培训通知】DockOne将会于2018年7月13日在上海举办Kubernetes技术培训,培训内容包括:Docker介绍、Docker镜像、网络、存储、容器安全;Kubernetes架构、设计理念、常用对象、网络、存储、网络隔离、服务发现与负载均衡;Kubernetes核心组件、Pod、插件、微服务、云原生、Kubernetes Operator、集群灾备等。同时深圳站培训也已经启动,欢迎咨询。
从Docker IRC频道以及stackoverflow的问题来看,很多人还不是很明白Docker Volume的工作原理。在这篇文章中,我会尽最大的努力来解释Volume是如何工作的,并展示一些最佳实践。这篇文章主要是针对那些对Volume不了解的Docker用户,当然有经验的用户也可以通过本文了解一些Volume的细节。
想要了解Docker Volume,首先我们需要知道Docker的文件系统是如何工作的。Docker镜像是由多个文件系统(只读层)叠加而成。当我们启动一个容器的时候,Docker会加载只读镜像层并在其上(译者注:镜像栈顶部)添加一个读写层。如果运行中的容器修改了现有的一个已经存在的文件,那该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本仍然存在,只是已经被读写层中该文件的副本所隐藏。当删除Docker容器,并通过该镜像重新启动时,之前的更改将会丢失。在Docker中,只读层及在顶部的读写层的组合被称为Union File System(联合文件系统)。
为了能够保存(持久化)数据以及共享容器间的数据,Docker提出了Volume的概念。简单来说,Volume就是目录或者文件,它可以绕过默认的联合文件系统,而以正常的文件或者目录的形式存在于宿主机上。
我们可以通过两种方式来初始化Volume,这两种方式有些细小而又重要的差别。我们可以在运行时使用
xxxxxxxxxx
1
-v
已复制
来声明Volume:
xxxxxxxxxx
1
$ docker run -it --name container-test -h CONTAINER -v /data debian /bin/bash
2
root@CONTAINER:/# ls /data
3
root@CONTAINER:/#
已复制
上面的命令会将
xxxxxxxxxx
1
/data
已复制
挂载到容器中,并绕过联合文件系统,我们可以在主机上直接操作该目录。任何在该镜像
xxxxxxxxxx
1
/data
已复制
路径的文件将会被复制到Volume。我们可以使用
xxxxxxxxxx
1
docker inspect
已复制
命令找到Volume在主机上的存储位置:
xxxxxxxxxx
1
$ docker inspect -f {{.Volumes}} container-test
已复制
你会看到类似的输出:
xxxxxxxxxx
1
map[/data:/var/lib/docker/vfs/dir/cde167197ccc3e138a14f1a4fb32cec92e79059437a9]
已复制
这说明Docker把在
xxxxxxxxxx
1
/var/lib/docker
已复制
下的某个目录挂载到了容器内的
xxxxxxxxxx
1
/data
已复制
目录下。让我们从主机上添加文件到此文件夹下:
xxxxxxxxxx
1
$ sudo touch /var/lib/docker/vfs/dir/cde167197ccc3e13814fb32ce9059437a9/test-file
已复制
进入我们的容器内可以看到:
xxxxxxxxxx
1
$ root@CONTAINER:/# ls /data
2
test-file
已复制
只要将主机的目录挂载到容器的目录上,那改变就会立即生效。我们可以在Dockerfile中通过使用
xxxxxxxxxx
1
VOLUME
已复制
指令来达到相同的目的:
xxxxxxxxxx
1
FROM debian:wheezy
2
VOLUME /data
已复制
但还有另一件只有
xxxxxxxxxx
1
-v
已复制
参数能够做到而Dockerfile是做不到的事情就是在容器上挂载指定的主机目录。例如:
xxxxxxxxxx
1
$ docker run -v /home/adrian/data:/data debian ls /data
已复制
该命令将挂载主机的
xxxxxxxxxx
1
/home/adrian/data
已复制
目录到容器内的
xxxxxxxxxx
1
/data
已复制
目录上。任何在
xxxxxxxxxx
1
/home/adrian/data
已复制
目录的文件都将会出现在容器内。这对于在主机和容器之间共享文件是非常有帮助的,例如挂载需要编译的源代码。为了保证可移植性(并不是所有的系统的主机目录都是可以用的),挂载主机目录不需要从Dockerfile指定。当使用
xxxxxxxxxx
1
-v
已复制
参数时,镜像目录下的任何文件都不会被复制到Volume中。(译者注:Volume会复制到镜像目录,镜像不会复制到卷)
数据共享如果要授权一个容器访问另一个容器的Volume,我们可以使用
xxxxxxxxxx
1
-volumes-from
已复制
xxxxxxxxxx
1
docker run
已复制
xxxxxxxxxx
1
$ docker run -it -h NEWCONTAINER --volumes-from container-test debian /bin/bash
2
root@NEWCONTAINER:/# ls /data
3
test-file
4
root@NEWCONTAINER:/#
已复制
值得注意的是不管container-test是否运行,它都会起作用。只要有容器连接Volume,它就不会被删除。
数据容器常见的使用场景是使用纯数据容器来持久化数据库、配置文件或者数据文件等。
官方的文档 上有详细的解释。例如:xxxxxxxxxx
1
$ docker run --name dbdata postgres echo "Data-only container for postgres"
已复制
该命令将会创建一个已经包含在Dockerfile里定义过Volume的postgres镜像,运行
xxxxxxxxxx
1
echo
已复制
xxxxxxxxxx
1
docker ps
已复制
xxxxxxxxxx
1
echo
已复制
xxxxxxxxxx
1
-volumes-from
已复制
xxxxxxxxxx
1
$ docker run -d --volumes-from dbdata --name db1 postgres
已复制
使用数据容器的两个注意点:
- 不要运行数据容器,这纯粹是在浪费资源。
- 不要为了数据容器而使用“最小的镜像”,如或
xxxxxxxxxx
1busybox
已复制,只使用数据库镜像本身就可以了。你已经拥有该镜像,所以并不需要占用额外的空间。xxxxxxxxxx
1scratch
已复制
备份如果你在用数据容器,那做备份是相当容易的:
xxxxxxxxxx
1
$ docker run --rm --volumes-from dbdata -v $(pwd):/backup debian tar cvf /backup/backup.tar /var/lib/postgresql/data
已复制
该示例应该会将Volume里所有的东西压缩为一个tar包(官方的postgres Dockerfile在/var/lib/postgresql/data目录下定义了一个Volume)
权限与许可通常你需要设置Volume的权限或者为Volume初始化一些默认数据或者配置文件。要注意的关键点是,在Dockerfile的
xxxxxxxxxx
1
VOLUME
已复制
xxxxxxxxxx
1
FROM debian:wheezy
2
RUN useradd foo
3
VOLUME /data
4
RUN touch /data/x
5
RUN chown -R foo:foo /data
已复制
该Docker file不能按预期那样运行,我们本来希望
xxxxxxxxxx
1
touch
已复制
xxxxxxxxxx
1
FROM debian:wheezy
2
RUN useradd foo
3
RUN mkdir /data && touch /data/x
4
RUN chown -R foo:foo /data
5
VOLUME /data
已复制
Docker可以将镜像中Volume下的文件挂载到Volume下,并设置正确的权限。如果你指定Volume的主机目录将不会出现这种情况。
如果你没有通过
xxxxxxxxxx
1
RUN
已复制
xxxxxxxxxx
1
CMD
已复制
xxxxxxxxxx
1
ENTRYPOINT
已复制
删除Volumes这个功能可能会更加重要,如果你已经使用
xxxxxxxxxx
1
docker rm
已复制
Volume只有在下列情况下才能被删除:
- 该容器是用命令来删除的(
xxxxxxxxxx
1docker rm -v
已复制是必不可少的)。xxxxxxxxxx
1-v
已复制 - 中使用了
xxxxxxxxxx
1docker run
已复制参数xxxxxxxxxx
1--rm
已复制
即使用以上两种命令,也只能删除没有容器连接的Volume。连接到用户指定主机目录的Volume永远不会被docker删除。
除非你已经很小心的,总是像这样来运行容器,否则你将会在
xxxxxxxxxx
1
/var/lib/docker/vfs/dir
已复制
延伸阅读以下资源更深入的探究了Volumes机制(译注:以下译文稍后奉上):
另外,我们可以期待不久的将来会更多的有关处理volumes的工具:
原文链接:Understanding Volumes in Docker(翻译:田浩浩 审校:李颖杰)