---
title: Howto Docker
categories: docker
---
* Documentation : <https://docs.docker.com/>
* Rôle Ansible : <https://gitea.evolix.org/evolix/ansible-roles/src/branch/stable/docker-host>
* Statut de cette page : test / bookworm
[Docker](https://www.docker.com/) est une solution qui permet de créer, déployer et gérer des conteneurs Linux.
Il intègre une gestion avancée des images permettant de les compiler, les compléter, les héberger, etc.
## Installation
Nous utilisons le paquet `docker-ce` des dépôts du projet Docker :
~~~
# chmod 755 /
# apt install apt-transport-https
# echo "deb https://download.docker.com/linux/debian bullseye stable" > /etc/apt/sources.list.d/docker.list
# wget -O /etc/apt/trusted.gpg.d/docker.asc https://download.docker.com/linux/debian/gpg
# dos2unix /etc/apt/trusted.gpg.d/docker.asc
# chmod 644 /etc/apt/trusted.gpg.d/docker.asc
# apt update
# apt install docker-ce docker-compose-plugin
# systemctl status docker
● docker.service - Docker Application Container Engine
Loaded: loaded (/lib/systemd/system/docker.service; enabled; preset: enabled)
Active: active (running) since Thu 2023-11-02 16:11:27 CET; 2 weeks 5 days ago
TriggeredBy: ● docker.socket
Docs: https://docs.docker.com
Main PID: 1255 (dockerd)
Tasks: 17
Memory: 115.2M
CPU: 3min 43.816s
CGroup: /system.slice/docker.service
└─1255 /usr/bin/dockerd -H fd:// --containerd=/run/containerd/containerd.sock
# docker -v
Docker version 28.0.2, build 0442a73
# docker info
Client: Docker Engine - Community
Version: 28.1.1
Context: default
Debug Mode: false
Plugins:
compose: Docker Compose (Docker Inc.)
Version: v2.35.1
Path: /usr/libexec/docker/cli-plugins/docker-compose
[…]
~~~
> Note: `/` doit avoir au moins `o+r` sinon cela peut poser des problèmes par la suite.
Concernant le firewalling pour Docker, voir [HowtoNetfilter](/HowtoNetfilter#docker).
Il faut ajouter un utilisateur dans le groupe Unix _docker_ pour pouvoir interagir avec le démon _dockerd_ sans passer root :
~~~
# adduser $USER docker
~~~
Cela permet à l'utilisateur d'accéder à la socket de Docker `/var/run/docker.sock`.
## Configuration
La configuration principale se passe dans le fichier `/etc/docker/daemon.json` que l'on configure ainsi :
~~~
{
"debug": false
,"data-root": "/var/lib/docker"
,"storage-driver": "overlay2"
,"live-restore": true
,"userns-remap": "default"
,"no-new-privileges": false
,"bip": "172.17.0.1/16"
,"fixed-cidr": "172.17.0.0/16"
}
~~~
Attention, pour modifier cette configuration, on conseille en général de le faire à froid,
et donc de stopper Docker, éditer sa configuration, et démarrer Docker ainsi :
~~~
# systemctl disable --now docker.socket ; systemctl stop docker
# vim /etc/docker/daemon.json
# systemctl enable --now docker.socket ; systemctl start docker
~~~
## Administration
### Stopper dockerd
Stopper `dockerd` n'est pas trivial car si l'on se contente de `systemctl stop docker`
il sera redémarré à la moindre sollicitation de sa socket.
Pour le stopper proprement il faut donc :
~~~
# systemctl disable --now docker.socket ; systemctl stop docker
# docker ps
Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?
~~~
Démarrer dockerd :
~~~
# systemctl enable --now docker.socket ; systemctl start docker
~~~
> Note : Si l'on se contente de stopper `docker` il sera redémarré à la moindre sollicitation de sa socket.
### Gestion des droits
Si un conteneur doit interagir avec des fichiers de l'hôte, nous conseillons de lancer le conteneur
avec les options suivantes dans `compose.yml` :
~~~
user: "1001:1001"
userns_mode: "host"
~~~
Il faut au préalable créer le répertoire correspondant au volume sur l'hôte, sinon les droits ne seront pas bons !!
~~~
$ id
uid=1001(foo) gid=1001(foo) groupes=1001(foo),995(docker)
$ mkdir datas/files
$ docker run -ti --userns host --user 1001:1001 -v /home/foo/data/files:/srv/files debian
~~~
## Utilisation basique
Une image Docker contient un système minimal avec un ou plusieurs services.
Un conteneur quant à lui est une instance (créée à partir d'une image) en cours d'exécution.
Voici un concentré des commandes les plus utiles :
~~~
# docker images
# docker ps -a
# docker logs <ID ou nom du conteneur> -f
# docker inspect <ID ou nom du conteneur> | less
# docker compose ls
# docker network ls
# docker info
# docker run -d --name test --rm busybox sleep infinity
# docker exec -it test /bin/sh
/ # nc -zv 172.17.0.1 5432
# docker run --publish 3333:3333 -ti debian
# docker run -ti --userns host --user 1001:1001 -v /home/foo/data/files:/srv/files debian
~~~
### Gérer les conteneurs
#### Lister les conteneurs
~~~
$ docker ps
~~~
Options utiles :
~~~
-a : lister tous les conteneurs (y compris ceux qui sont "éteint")
-l : lister les conteneurs récemment lancés
-q : lister uniquement les ID des conteneurs
~~~
Pour voir les [ressources utilisées par les conteneurs](#voir-les-ressources-utilisées-par-les-conteneurs)
#### Instancier un nouveau conteneur
~~~
$ docker run <image> [commande]
~~~
Si une commande spécifiée, celle-ci remplacera celle du `CMD` de l'image.
Options utiles :
~~~
--name NOM : donner un nom au conteneur
-p port_hôte:port_conteneur : rendre un port accessible depuis l'hôte
-d : lancer le conteneur en mode 'détaché'
-it : lancer le conteneur en mode intéractif avec tty
--network NOM : lancer le conterneur sur un réseau docker spécifique existant
--user nom_user|uid : lancer le process du conteneur avec l'utilisateur/uid spécifié
~~~
Options de montage :
~~~
- v <chemin-dossier-hôte>:<chemin-dossier-conteneur>
--mount type=<type>,src=<chemin-hôte>,dst=<chemin-conteneur>[...]
~~~
* On peut monter un dossier simplement avec l'option `-v`.
* Si on veut monter un fichier, il faut utiliser `--mount type=bind...` ( cela marche aussi pour les dossiers )
* Si on veut monter un "volume" docker, il faut utiliser `--mount type=volume,src=<nom-volume>,dst=<chemin-conteneur>`
* Si on veut un tmpfs (filesystem en ram) non persitant `--mount type=tmpfs,[tmpfs-size=<taille>,tmpfs-mode=<mode>]`
Lancer un conteneur pour faire des tests :
~~~
# docker run -it --rm debian /bin/bash
root@916438fc1bd0:/# apt update && apt install netcat-openbsd -y
root@916438fc1bd0:/# exit
~~~
Le conteneur est supprimé automatiquement lorsqu'on exit bash.
#### Démarrer un conteneur existant
Un conteneur existant est un conteneur précédemment instancié avec `docker
run`.
~~~
$ docker start <ID ou nom du conteneur>
~~~
#### Éteindre ou tuer un conteneur
~~~
$ docker stop|kill <ID ou nom du conteneur>
~~~
Lorsque le conteneur n'est plus en fonction, il existe toujours et peut être
listé à l'aide de la commande `docker ps -a`
#### Autostart d'un conteneur
Pour s'assurer qu'un conteneur démarre ou non au démarrage du démon Docker, il existe un paramètre RestartPolicy :
~~~
$ docker inspect -f "{{ .HostConfig.RestartPolicy.Name }}" <ID ou nom du conteneur>
~~~
Les valeurs possibles sont :
~~~
no Ne redémarre pas automatiquement le conteneur. (défaut)
on-failure Redémarre le conteneur s'il crash suite à une erreur (code de sortie non nul)
always Toujours redémarrer le conteneur s’il s’arrête. S'il est arrêté manuellement, il est redémarré uniquement lorsque le démon Docker redémarre ou que le conteneur lui-même est redémarré manuellement.
unless-stopped Semblable à always, sauf que lorsque le conteneur est arrêté (manuellement ou autrement), il n'est pas redémarré même après le redémarrage du démon Docker.
~~~
Pour mettre à jour la politique :
~~~
$ docker update --restart=always monconteneur
~~~
#### Supprimer un conteneur
~~~
$ docker rm <ID ou nom du conteneur>
~~~
#### Exécuter des commandes dans un conteneur en fonctionnement
~~~
$ docker exec <ID ou nom du conteneur> <commande>
~~~
Options utiles :
~~~
-t : alloue un TTY
-i : attache stdin (mode interactif)
~~~
On utilise habituellement la commande suivante pour obtenir un shell dans un conteneur en fonctionnement :
~~~
$ docker exec -ti <ID ou nom du conteneur> /bin/sh
~~~
#### Visionner les journaux d'un conteneur
Il s'agit en fait de la sortie standard et la sortie d'erreur du processus
lancé à l'intérieur du conteneur :
~~~
$ docker logs <ID ou nom du conteneur>
~~~
Options utiles :
~~~
-f : suivre les logs en direct
-t : afficher un timestamp devant chaque ligne
~~~
#### Afficher les informations d'un conteneur
~~~
$ docker inspect <ID ou nom du conteneur>
~~~
Cette commande s'applique généralement à n'importe quel objet Docker
(conteneur, image, service, réseau…) et donne une liste exhaustive des
attributs de l'objet, formaté en JSON.
Il est aussi possible de récupérer une sous partie en utilisant l'argument --format
~~~
# Récupérer les IP du container d05daab5c59e
$ docker inspect d05daab5c59e --format "{{range .NetworkSettings.Networks }}{{ .IPAddress }}{{ end }}"
# Récupérer l'IP du container f4bae02ef1407adc92f1aa2cc32c8e9fae75dac87126e2bf4964db265e9ad55d sur l'interface docker_gwbridge
$ docker inspect docker_gwbridge --format "{{ .Containers.f4bae02ef1407adc92f1aa2cc32c8e9fae75dac87126e2bf4964db265e9ad55d.IPv4Address }}"
~~~
Note : De notre expérience, l'option --format peut se montrer capricieuse, notamment s'il y a en jeu des identifiant de containers. Une alternative est de parser du json manuellement avec [jq](https://wiki.evolix.org/TipsShell#json-avec-jq )
#### Communication entre un conteneur et son hôte
##### Exposer un service du conteneur dans l'hôte
Le principe de Docker est de compartimenter ou isoler un service de l'hôte qui l'héberge.
Pour exposer un service du conteneur, on lancera le conteneur avec l'option `-p` pour mapper un port de l'hôte vers le conteneur :
~~~
$ docker run -p <HOST_INTERFACE_IP>:<HOST_PORT>:<CONTAINER_PORT> (…)
~~~
On utilisera de préférence `127.0.0.1` comme `<HOST_INTERFACE_IP>`. Si on a besoin d'exposer le service à l'extérieur, on mettra en place un reverse proxy qui gèrera la teminaison SSL, [avec Nginx par exemple](https://wiki.evolix.org/HowtoNginx#proxy_pass).
Documentation : <https://docs.docker.com/engine/reference/commandline/run/#publish>
##### Fournir un service de l'hôte au conteneur
Pour faire l'inverse, c'est-à-dire permettre au conteneur d'accèder à un service de l'hôte, il faut :
1. Faire écouter ce service sur l'IP de l'interface réseau Docker commune entre l'hôte et le conteneur (par défaut `docker0`).
2. Autoriser l'IP du conteneur sur ce port dans le firewall de l'hôte.
### Gérer les images
#### Lister les images locales
~~~
$ docker image ls
~~~
#### Construire une image
Pour construire ou mettre à jour une image :
~~~
$ docker build <repertoire>
~~~
Le répertoire doit contenir un fichier _Dockerfile_ décrivant l'image à
construire.
Option utiles :
~~~
-t : ajoute un tag à l'image
~~~
#### Ajouter un tag à une image existante
~~~
$ docker tag <tag actuel> <nouveau tag>
~~~
#### Pousser une image sur un dépôt distant
~~~
$ docker push <image>
~~~
Avant de pousser une image, il est nécessaire de lui attribuer le bon _tag_ qui
doit contenir l'adresse du dépôt distant.
Par exemple pour pousser l'image _foo-image_ sur le dépôt Docker _registry.example.net:5000_ :
~~~
$ docker tag foo-image registry.example.net:5000/foo-image
$ docker push registry.example.net:5000/foo-image
~~~
#### Récupérer une image d'un dépôt distant
~~~
$ docker pull <image>
~~~
#### Copier des fichiers dans/depuis un conteneur
~~~
$ docker cp <fichier> <conteneur>:<chemin>
~~~
On peut aussi le faire de conteneur à conteneur :
~~~
$ docker cp <conteneurA>:<fichier> <conteneurB>:<chemin>
~~~
#### save / load
On peut « exporter » une image :
~~~
$ docker image save -o foo.tar 69bac37343a4
~~~
Et restaurer ainsi :
~~~
$ docker image load -i foo.tar
~~~
## Astuces
Éteindre/Tuer/Supprimer tous les conteneurs :
~~~
$ docker ps -aq |xargs -r docker stop|kill|rm
~~~
Supprimer toutes les images :
~~~bash
$ docker images -q |xargs -r docker image rm
~~~
Démarrer un conteneur existant avec un shell bash (pour des fins de debug par exemple) :
~~~
$ docker run -it IMAGE bash
~~~
## Configuration avancée
### Firewall
**Important** : Il faut configurer votre firewall, voir [HowtoNetfilter#docker](/HowtoNetfilter#docker)
### Chemin de stockage
Par défaut, Docker va stocker ses informations dans `/var/lib/docker/`.
Si une utilisation non négligeable de Docker est faite, cela risque de saturer votre partition `/var`
et nous conseillons de déplacer ce stockage dans `/home` ou `/srv` :
~~~
# systemctl disable --now docker.socket ; systemctl stop docker
# mv /var/lib/docker /home
# ln -s /home/docker /var/lib/docker
# systemctl enable --now docker.socket ; systemctl start docker
~~~
> Note : attention, la partition de destination doit être en `exec` mais a priori peut être en `nosuid,nodev` (à confirmer)
À noter que l'on peut également modifier le paramètre `data-root` (anciennement `graph`) dans `/etc/docker/daemon.json`
mais nous déconseillons de faire cela.
### storage-driver
<https://docs.docker.com/engine/storage/drivers/select-storage-driver/>
<https://docs.docker.com/engine/storage/drivers/overlayfs-driver/>
Par défaut, le mode de stockage des informations de Docker est "overlay2" :
~~~
# docker info | grep "Storage Driver"
Storage Driver: overlay2
~~~
De façon exceptionnelle, on peut vouloir changer cela via le paramètre `storage-driver` dans `/etc/docker/daemon.json`.
### TLS
Lorsque le docker-engine est exposé, il est important de le sécuriser avec TLS.
Au moment de l'installation, une version altérée de shellpki est copiée dans le
répertoire docker/tls. Ensuite, les certificats et la clé sont créés pour le
serveur. (`shellpki init`)
Pour autoriser des hôtes à se connecter à l'engine, il faut leur créer une clé
et un certificat.
Pour ce faire, il suffit de lancer le script:
~~~
/home/docker/tls$ ./shellpki create
~~~
Les fichiers seront créés, par défaut, dans le répertoire
`/home/docker/tls/files/$CN`
### Blocs adresses IP
La liste des plages utilisées par défaut est dans le [git](https://github.com/moby/moby/blob/master/libnetwork/ipamutils/utils.go), codé en dur avec `globalScopeDefaultNetworks` et `localScopeDefaultNetworks`
> **ATTENTION** Il faut éviter les collisions avec d'autres réseaux
On peut configurer ces plages, pour que les changement sur soient pris en compte, il faudra redemarrer le démon docker.
Docker utilise différentes plages d'ips pour **3 choses différentes** :
* Le bridge par défaut `docker0` ( dans `localScopeDefaultNetworks` )
il faut indiquer dans `/etc/docker/daemon.json`
~~~
[...]
,"bip": "172.17.0.1/16"
,"fixed-cidr": "172.17.0.0/16"
~~~
`bip` est l'ip du bride et `fixed-cidr` est la plage d'ip en notation CIDR (bien mettre en `.0/XX`) utilisable par le bridge
> Il est parfois difficile de changer le CIDR utilisé par docker0, on conseil de passer temporairement à un autre CIDR inutilisé, par exemple 10.0.1.1/24, puis de mettre le CIDR voulu. On peut aussi supprimer les bridges custom, cela peut aider.
* Les bridges customs `User-defined bridges` ( dans `localScopeDefaultNetworks` ) créés par l'utilisateur
~~~
[...]
,"default-address-pools":[
{"base":"172.24.0.0/13","size":24},
{"base":"10.200.0.0/16","size":24}
]
~~~
Avec `default-address-pools` on définit une liste de plages utilisables pour les bridges customs.
`base` est la plage d'ip en notation CIDR (bien mettre en `.0/XX`) utilisable pour créer des bridges
`size` est la taille (masque) des bridges
* Avec docker swarm ( dans `globalScopeDefaultNetworks` ), voir la section sur swarm plus bas
### Rétention des logs
<https://docs.docker.com/engine/logging/drivers/local/>
Par défaut, les logs des conteneurs qui tournent sont conservés ( compréssé ) avec une limite de 100M par conteneurs, tant que le conteneur n'est pas supprimé
dans `/etc/docker/daemon.json`, on peux changer ce comportement :
```
"log-driver": "local",
"log-opts": {
"max-file": "3"
"max-size": "10m"
}
```
On stockera seulement 3x30M par conteneur ici par exemple
Cette valeur peux être overridé au lancement d'un conteneur via les option de type `--log-opt max-size=10m`
## Plomberie
### Le démon Docker et son client
Docker est une application en mode client-serveur. *dockerd* est un démon qui
fournit une API REST afin d'interagir avec les conteneurs. *docker* est un
client qui permet d'interagir avec le démon en ligne de commande. Il peut
interagir avec un démon en local (sur la même machine) ou avec un démon sur une
machine distante.
### Image
Une image est un template contenant des instructions pour créer un conteneur
docker. Ces instructions sont listées dans un fichier nommé *Dockerfile*. La
plupart du temps, une image se base sur une autre image ce qui crée un système
de couches. Lorsqu'on modifie une image, seules les couches qui sont modifiées
sont reconstruites.
Une fois qu'une image est créée on peut la publier dans un *registry* (`docker
push`).
### Conteneur
Un conteneur est une instance exécutable d'une image.
### Stack, service et task
Lorsque Docker fonctionne en _swarm mode_ (en cluster), les notions de
_stack_, _service_ et _task_ sont introduites, en plus des précédentes.
Un _service_ est un objet qui contient des informations comme l'image Docker à
instancier, des contraintes de placement ou de limitation de ressources, des
objets à lier au conteneur qui sera lancé (volumes, réseau, etc…), le nombre
de réplicas à démarrer, etc…
Les services se manipulent avec la commande `docker service`, mais généralement
on les définit dans un fichier YAML. On peut définir plusieurs services dans un
fichier YAML ainsi que d'autres objets dont les services font référence
(_volume_, _network_, _secret_, _config_, etc…). Cet ensemble représente alors
une _stack_, que l'on peut manipuler avec la commande `docker stack`.
Un _service_ démarre donc un ou plusieurs réplicas. Ces réplicas sont appelés
des _tasks_. Chaque _task_ lance un et un seul conteneur. Les conteneurs étant
des processus Docker indépendant, l'ordonnanceur de Docker Swarm introduit la
notion de _task_ afin de manipuler les conteneurs. Concrètement, une _task_
représente un conteneur et un état dans lequel il est (_running_, _failed_,
_stopped_ et des états transitoires). Sur le même principe qu'une unité
systemd, monit ou supervisord peut surveiller ses processus et les redémarrer
en cas de besoin, une _task_ Docker se comporte de la même manière avec son
conteneur.
Voir : [https://docs.docker.com/engine/swarm/how-swarm-mode-works/services/#services-tasks-and-containers](https://docs.docker.com/engine/swarm/how-swarm-mode-works/services/#services-tasks-and-containers)
## Dockerfile
Les fichiers _Dockerfile_ décrivent les étapes de construction d'une image. Ils
permettent de reconstruire à l'identique votre image et de connaitre exactement
ce qui a été fait. Ainsi au lieu de distribuer une image potentiellement
volumineuse, on distribue uniquement la procédure de construction
(_Dockerfile_) et les quelques fichiers annexes.
Référence pour la syntaxe des fichiers _Dockerfile_ : [https://docs.docker.com/engine/reference/builder/](https://docs.docker.com/engine/reference/builder/)
### Procédure de création d'une nouvelle image
Exemple avec une image exécutant rsyslog :
- depuis un répertoire vierge, création d'un fichier _Dockerfile_ :
~~~
~/docker-images/rsyslog $ $EDITOR Dockerfile
# Image sur laquelle notre image se base
FROM debian:stretch
# Champs optionnels
LABEL maintainer="John Doe <jdoe@example.com>"
# Installation des paquets voulus
ENV DEBIAN_FRONTEND noninteractive
RUN apt-get update \
&& apt-get install -y --no-install-recommends rsyslog procps \
&& rm -rf /var/lib/apt/lists/*
# Configuration de rsyslog. On peut modifier la configuration directement ou
# bien copier des fichiers de notre machine
RUN sed -i 's/^#\(module(load="imudp")\)/\1/; s/^#\(input(type="imudp" port="514")\)/\1/' /etc/rsyslog.conf
COPY custom.conf /etc/rsyslog.d/
# /var/log/ est un volume qui doit être monté depuis l'extérieur lors de
# l'exécution du conteneur
VOLUME /var/log/
# Le port 514/udp est rendu public à l'extérieur du conteneur à son exécution
EXPOSE 514/udp
# La commande suivante est exécutée lorsque le conteneur est exécuté, en mode "shell"
CMD /usr/sbin/rsyslogd -n
# Equivalent à CMD ["/bin/sh","-c","/usr/sbin/rsyslogd","-n"] (format JSON)
~~~
Dans la mesure du possible, voici quelques bonnes pratiques à respecter :
- la commande spécifiée par _CMD_ doit s'exécuter en avant plan et ne pas
forker. Si la commande rend la main, le conteneur sera alors arrêté ;
- la commande doit envoyer ses logs sur stdout et/ou stderr. Cela permet de
les consulter directement à l'aide de `docker logs`.
Un exemple à ne **pas** écrire :
~~~
CMD /usr/bin/foo -d; tail -f /var/log/foo.log
~~~
Dans le cas où `/usr/bin/foo -d` lance le démon foo en arrière plan, le
conteneur s'exécutera correctement mais Docker va monitorer le processus tail
et non plus foo. Si foo crash, le conteneur ne passera pas en _failed_ et ne
pourra pas être redémarré automatiquement.
À supposer que foo ne puisse pas envoyer ses logs sur stdout, le bon example
serait :
~~~
CMD touch /var/log/foo.log && tail -f /var/log/foo.log & /usr/bin/foo
~~~
À noter que seulement une seule directive `CMD` est acceptée dans un _Dockerfile_.
Ici l'exécutable est spécifié pas l'instruction `CMD` mais ce n'est pas toujours le cas.
L'instruction `ENTRYPOINT` peut être utilisé pour spécifier l'exécutable, tandis que CMD permettra de donner les arguments.
Dans ce cas `ENTRYPOINT` et `CMD` doivent être spécifiés au format JSON.
À noter qu'il peut y avoir plusieurs instructions `ENTRYPOINT` dans un _Dockerfile_ mais seul la dernière sera prise en compte.
On peut ensuite construire notre image, en lui donnant ici le _tag_ _rsyslog_ :
~~~
~/docker-images/rsyslog $ ls
Dockerfile custom.conf
~/docker-images/rsyslog $ docker build -t rsyslog .
~/docker-images/rsyslog $ docker image ls
REPOSITORY TAG IMAGE ID CREATED SIZE
rsyslog latest 4bea99cda08c 8 minutes ago 470MB
debian stretch 5b712ae16dd7 3 days ago 100MB
~~~
## Docker registry
Un *registry* sert à héberger des images Docker.
Il existe des registres publics tels que *docker hub* ou *docker cloud* mais il est possible d'héberger son propre *registry*.
On peut le déployer avec la _stack_ suivante :
~~~
version: "3.6"
services:
registry:
image: registry:2
deploy:
replicas: 1
restart_policy:
condition: on-failure
environment:
REGISTRY_HTTP_TLS_CERTIFICATE: /run/secrets/certificate
REGISTRY_HTTP_TLS_KEY: /run/secrets/certificate
REGISTRY_HTTP_ADDR: 0.0.0.0:5000
volumes:
- registry:/var/lib/registry
secrets:
- certificate
ports:
- :5000:5000
volumes:
registry:
secrets:
certificate:
file: certificate.pem
~~~
Attention, le certificat doit absolument être valide et le Common Name doit correspondre avec le nom utilisé pour y accéder.
Lors d'un déploiement d'une stack existante, en cas d'erreur :
~~~
image registrydocker.example.com:5000/XXX could not be accessed on a registry to record
its digest. Each node will access registrydocker.example.com:5000/XXX independently,
possibly leading to different nodes running different
versions of the image.
~~~
Il peut s'agir de différents problèmes (réseau, SSL, etc…), Docker n'est pas très bavard sur la cause de l'échec. Un bon moyen de déboguer la situation est avec :
~~~
$ curl https://registrydocker.example.com:5000/v2/_catalog
~~~
La requête devrait retourner la liste des images hébergées au format json.
## Swarm
Swarm permet de mettre en communication plusieurs hôtes Docker afin d'en former
un cluster. On pourra ainsi déployer des applications multi-conteneurs sur
plusieurs machines.
### Initialiser le cluster
~~~
docker0# docker swarm init
~~~
Joindre les autres machines au cluster créé (il vous suffit généralement de copier-coller la commande retournée par `docker swarm init` :
~~~
docker1# docker swarm join --token <token> <IP du premier node>
~~~
* Pour limiter les plages d'ips (pool / range) que peux utiliser docker pour swarm (notamment pour éviter des conflit avec le 10.0.0.0/8 utilisé par défaut qui pourrait être utilisé ailleur), il faut initialiser la swarm avec l'option `--default-addr-pool 172.24.0.0/13` avec la pool en notation CIDR.
> **Attention** : on ne pourra pas changer cela aprés que la swarm ait été initialisé !
* Pour indiquer sur quel réseau / adresse les noeuds de la swarm vont communiquer, il faut ajouter les option `--listen-addr 10.0.0.1:2377 --advertise-addr 10.0.0.1` (par exemple)
Par défaut la machine sur laquelle le cluster a été initialisée a le rôle de
_manager_, et les suivantes ont le rôle de _worker_. On ne peut déployer de
nouveaux services que depuis les _managers_. Les _workers_ se contentent de
recevoir les services à rouler.
Pour ajouter des machines plus tard, il suffit de générer un nouveau token :
~~~
docker0# docker swarm join-token <manager|worker>
~~~
### Lister les machines du cluster
~~~
# docker node ls
~~~
### Ajouter des labels à une machine
~~~
# docker node update --label-add <clé>=<valeur> <machine>
~~~
Les _labels_ servent notamment à définir des contraintes de placement des
services lors de l'utilisation de _docker stack_.
### Drainer une machine du cluster
Pour effectuer un maintenance ou autre sur une machine (node), il faut la drainer (déplacer tous ses conteneurs vers les autres noeuds)
~~~
# docker node update --availability drain <node>
~~~
On peut verifier qu'il n'y a plus de services qui tournent sur cette machines [#lister-toute-les-tasks-de-tous-les-services-sans-docker-service](#lister-toute-les-tasks-de-tous-les-services-sans-docker-service)
### Supprimer une machine du cluster
De préférence après avoir drainé le noeud
~~~
# docker node rm <hash-machine>
~~~
### Statut worker/manager
Les nœuds peuvent avoir le statut "worker" ou "manager". Seuls les managers peuvent modifier les droits et la topologie du cluster. Ça se décide au « join » mais peut se modifier après :
~~~
# docker node [promote|demote] <node>
~~~
## Compose/stack (docker stack)
Docker permet de déployer des infrastructures multi-conteneurs (_stacks_) simplement à l'aide de `docker stack` (anciennement Docker Compose, logiciel tier). Il est très utile dans le cadre de déploiement sur un cluster Swarm.
L'infra est à décrire dans un fichier YAML.
### Déployer (ou mettre à jour à chaud) une nouvelle _stack_
~~~
# docker stack deploy -c <stack_name.yml> <stack name>
~~~
### Lister les _stacks_
~~~
# docker stack ls
~~~
### Lister les _services_, toutes _stacks_ confondues ou pour une _stack_ donnée
~~~
# docker service ls
# docker stack services <stack name>
~~~
### Lister les _tasks_ (replicas) d'une _stack_ ou d'un _service_ donné
~~~
# docker stack ps <stack name>
# docker service ps <service name>
~~~
### Lister toute les _tasks_ de tous les _services_ (sans docker service)
~~~
# for stack_name in $(docker stack ls --format "table {{.Name}}");do docker stack ps $stack_name 2>&1 | sed 1d | grep -v "nothing found in stack" ;done ;
# On peut aussi filtrer avec les task uniquement sur un noeud de la swarm
# for stack_name in $(docker stack ls --format "table {{.Name}}");do docker stack ps $stack_name --filter "NODE=nodeName" 2>&1 | sed 1d | grep -v "nothing found in stack" ;done ;
~~~
### Supprimer une _stack_
~~~
# docker stack rm <stack name>
~~~
### Fichier YAML de description de _stack_ (anciennement _docker-compose.yml_)
Les _stacks_ Docker se décrivent à l'aide d'un fichier YAML. Anciennement le
déploiement d'une _stack_ se faisait à l'aide de Docker-compose et le fichier
s'appelait couramment _docker-compose.yml_. Docker stack ne définit pas de nom
par défaut donc il peut porter n'importe quel nom.
Le fichier contient une description de tous les objets Docker à créer pour
déployer une _stack_ de zéro.
Tout ce que l'on peut faire avec le fichier YAML peut être fait avec les
commandes docker équivalentes (`docker service`, `docker volume`, `docker
config`, etc…). Le nom des commandes et options sont exactement les mêmes. Le
format YAML permet simplement de rendre plus simple la description d'une
_stack_ qu'une série de commandes.
Référence sur le format du fichier :
[https://docs.docker.com/compose/compose-file/](https://docs.docker.com/compose/compose-file/)
Voici un aperçu :
~~~
$ cat ma-stack.yml
version: "3.6"
services:
web:
image: my-website:latest
deploy:
replicas: 2
restart_policy:
condition: on-failure
ports:
- "80:80"
- "443:443"
environment:
- MYSQL_DB=foo_dev
- MYSQL_USER=foo_dev
- MYSQL_PASS=deb2Ozpifut?
secrets:
- ssl_cert
configs:
- source: nginx
target: /etc/nginx/nginx.conf
mysql:
image: mariadb:latest
deploy:
replicas: 1
restart_policy:
condition: on-failure
placement:
constraints:
- node.labels.role == sql
volumes:
- mysql-datadir:/var/lib/mysql
volumes:
mysql-datadir:
configs:
nginx:
file: nginx.conf
secrets:
ssl_cert:
file: example.com.pem
~~~
On lance ici 2 _services_, _web_ et _mysql_. On spécifie que _web_ doit avoir 2
réplicas, il y aura donc 2 _tasks_ (et donc 2 conteneurs) qui seront démarrés,
peu importe où sur le cluster.
Pour le service _mysql_ par contre, on spécifie une contrainte de placement de
la _task_, elle doit être démarré sur une machine du cluster ayant le label
_role == sql_. La raison est que comme on lui a associé un volume pour son
_datadir_, il doit toujours être exécuter sur la même machine (les volumes ne
sont pas répliqués entre les machines d'un cluster).
On ne spécifie pas de chemin pour le _volume_ _mysql_datadir_, donc Docker le
créera par défaut dans _/var/lib/docker/volumes/ma-stack_mysql-datadir/ sur la
machine hôte.
Le _service_ _web_ à besoin d'une _config_ appelée _nginx_ et d'un _secret_
appelé _ssl_cert_ que l'on déclare tout en bas et qui contiennent
respectivement le fichier _nginx.conf_ et _example.com.pem_ dans notre
répertoire courant, à côté du _ma-stack.yml_. Lorsque Docker crée une _config_
ou un _secret_ (au déploiement de la _stack_), il les rend disponible à tous
les membres du cluster, ce qui fait qu'on n'a pas besoin de spécifier de
contrainte de placement pour _web_.
Ensuite on peut déployer notre _stack_ :
~~~
$ ls
ma-stack.yml nginx.conf example.com.pem
$ docker stack deploy -c ma-stack.yml ma-stack
~~~
### Surcharge de paramètre
On peut surcharger certains paramètres définit dans le premier en créant un
second fichier contenant seulement les paramètres à surcharger. Les 2 fichiers
devront être passer en paramètre de `docker stack deploy` et ils seront alors
fusionnés. Cela permet de réutiliser un fichier de _stack_ pour différents
environnement (preprod, prod…) en changeant uniquement des variables
d'environement, mots de passe, etc…
~~~
$ cat ma-stack.dev.yml
version: "3.6"
services:
web:
environment:
- DEBUG=1
- MYSQL_DB=foo_dev
- MYSQL_USER=foo_dev
- MYSQL_PASS=deb2Ozpifut?
~~~
On peut ensuite déployer ainsi :
~~~
$ docker stack deploy -c ma-stack.yml -c ma-stack.dev.yml ma-stack
~~~
## Réseaux (docker network)
Docker permet de gérer différentes topologies de réseaux pour connecter les conteneurs entre eux à l'aide de `docker network`.
_drivers_ réseau supportés :
- _bridge_ : utilise les bridges Linux, chaque bridge est isolée des autre reseaux et docker et permet de resoudre les noms des conteneurs au sein du bridge.
- _host_ : Aucune isolation réseaux, le conteneur tourne comme un processus normal dans le namespace par défaut : il partage le réseaux avec son hôte.
- _overlay_ : utilisé dans le cas d'un cluster Swarm, permet d'avoir un
réseau unique partagé entre tous les hôtes Docker et permet de faire du
load-balancing entre les conteneurs (replicas) d'un service ;
- _macvlan_ : permet d'assigner directement des adresses IP publiques aux
conteneurs (chaque conteneur à une mac unique), donc aucun NAT n'est fait contrairement aux précédents.
> Attention l'interface de l'hôte doit être configurée pour fonctionner en mode "promiscuité" pour que cela fonctionne.
- _ipvlan_ : Comme _macvlan_ sauf que la mac utilisée est celle de l'hôte donc pas besoin d'activer la promiscuité.
- _none_ : Isolation complete du conteneur
Créer un réseau :
~~~
# docker create -d <driver> […] <network name>
~~~
Lister les réseaux créés :
~~~
# docker network ls
~~~
Informations détaillées sur un réseau :
~~~
# docker network inspect <network name>
~~~
Pour voir les subnet ou plages d'ips utilisé par chaque réseau :
~~~
# for n in `docker network ls --quiet` ; do docker network inspect $n --format "network {{ .Name }} has subnet : {{range .IPAM.Config }}{{ .Subnet }} with gateway {{ .Gateway }}{{ end}}" ; done
~~~
## Volumes (docker volume)
Les volumes Docker sont des répertoires ou fichiers présents sur l'hôte qui
peuvent être montés à l'intérieur des conteneurs. L'intérêt est de pouvoir
écrire des données persistantes depuis les conteneurs, qui seront alors
conservés après arrêt et suppression du conteneur et accessible depuis l'hôte.
Les volumes sont indépendants des conteneurs.
Ils sont généralement utilisés pour stocker des fichiers de logs, des
répertoires de bases de données ou des configuration.
Sauf si un chemin est spécifié, Docker mets ses volumes dans
_/var/lib/docker/volumes/_, et les données sont accessibles dans
_/var/lib/docker/volumes/"nom du volume"/\_data/_.
On peut gérer les volumes avec la commande `docker volume` :
~~~
# docker volume create vol1
vol1
# docker volume ls
DRIVER VOLUME NAME
local vol1
# docker volume rm vol1
vol1
~~~
Dans le cas d'un cluster Docker Swarm, les volumes ne sont pas répliqués entre
les membres du cluster. Si un conteneur monte un volume, il faut bien penser à
restreindre son placement à un Docker node spécifique, ou bien mettre en place
un système de réplication de fichiers tier.
## Fichiers de configuration (docker config)
Les _config_ sont des objets permettant de stocker un unique fichier,
généralement un fichier de configuration d'un service.
À la différence des volumes, les _config_ sont répliqués au sein d'un cluster
Swarm, ce qui permet de ne pas avoir à copier le fichier de configuration sur
chaque serveur. Lors de la création de l'objet config, il sera rendu accessible
à tous les membres du cluster qui en auront besoin.
À l'intérieur des conteneurs, les objets _config_ sont montés en lecture seule.
Un processus qui a besoin de réécritre lui-même sa configuration durant son
exécution ne marchera donc pas, et il faudra préférer l'utilisation d'un
volume.
Les _config_ ne peuvent pas non plus être mis à jour lors d'un redéploiement de
stack :
~~~
failed to update config foo: Error response from daemon: rpc error: code = InvalidArgument desc = only updates to Labels are allowed
~~~
Il faut obligatoirement soit supprimer l'objet _config_ et donc les objets qui
en dépendent (conteneurs), soit créer un nouveau _config_ (avec un nouveau nom
donc) et l'ajouter au conteneur en question (non testé). On perd donc la
souplesse des volumes dans ce cas là.
Les _config_ se gèrent avec la commande `docker config`. Le serveur doit avoir
le rôle _manager_ dans le cluster Swarm pour pouvoir créer un objet _config_,
puisque cela impacte l'ensemble du cluster :
~~~
# docker config create vim-config .vimrc
07kaw58mhvtkqem46ipkd97i1
# docker config ls
ID NAME DRIVER CREATED UPDATED
07kaw58mhvtkqem46ipkd97i1 vim-config Less than a second ago Less than a second ago
# docker config rm vim-config
vim-config
~~~
## Fichiers sensibles (docker secrets)
Ce sont des objets permettant de stocker des fichiers, au même titre que les
_configs_, mais dédiés aux fichiers sensibles comme les clés privée ou fichiers
contenant des mots de passe.
Ils sont rendus accessibles dans _/run/secrets/_ dans les conteneurs.
Les _secret_ héritent des mêmes caractéristiques que les _config_ (voir
ci-dessus), à savoir qu'ils sont accessibles partout dans un cluster Swarm mais
ne peuvent ni être modifiés depuis un conteneur ni depuis l'hôte, ils doivent
être recréés en cas de modification.
Les _config_ se gèrent avec la commande `docker secret`.
## FAQ
### Les conteneurs ont des problèmes de connectivités entre eux/vers l'extérieur
C'est très probablement lié à un outil manipulant les règles netfilter qui a
effacé les règles spécifiques à Docker, notamment dans la table _nat_.
Pour restaurer les règles netfilter de Docker, il n'y a pas d'autre moyen que
de redémarrer le démon :
~~~
# /etc/init.d/docker restart
~~~
### Voir les ressources utilisées par les conteneurs
On peut voir quelle conteneur prennent le plus de ressources (Cpu, Memoire, Disque) avec docker stats.
Par defaut docker stats fonctionne un peu comme htop et met a jour la sortie
~~~
$ docker stats [OPTIONS] [CONTAINER...]
~~~
Options utiles :
~~~
-a : lister tous les conteneurs (y compris ceux qui sont "éteint")
--no-stream : avoir un seule sortie
--no-trunc : ne pas tronquer la sortie (largeur des colonnes)
~~~
Avoir une sortie style ps:
~~~
docker stats --no-stream --no-trunc
~~~
### Espace insuffisant lors du build d'une image
Solutions:
- Vérifier que le "build context" n'est pas trop grand.
- Modifier la variable d'environnement DOCKER_TMPDIR .
- Créer un fichier .dockerignore pour exclure des fichiers et répertoires
du "build context"
*Build context: Tout ce qui se trouve à la racine du Dockerfile.*
### Voir et modifier le _ENTRYPOINT_ et le _CMD_ d'une image pour déboguer
Voir les commandes
~~~
$ docker image inspect $nomImage -f "{{ .Config.Entrypoint }}{{ .Config.Cmd}}"
~~~
Lancer l'image en changeant le Entrypoint
~~~
$ docker run -d --entrypoint="/bin/sleep" $imageConteneur infinity
$ docker run -d --entrypoint="" $imageConteneur echo hello
~~~
L'option `--entrypoint` remplace le Entrypoint et Cmd
Re-créer l'image en modifiant un conteneur de cette image
~~~
$ docker commit -c 'ENTRYPOINT ["/bin/sleep"]' -c 'CMD ["infinity"]' $idConteneur $nomImage:tag
~~~
### Lors d'un redéploiement d'une stack Docker (docker stack deploy), les services ne sont pas redémarrer avec la nouvelle image
Vérifier que le tag _latest_ est bien précisé dans le nom de l'image dans le _docker-stack.yml_ :
~~~
image: registrydocker.example.com:5000/foo:latest
~~~
### Est-il possible de ne faire écouter un service d'une stack que sur une interface précise de la machine hôte (par exemple sur un LAN privé) ?
Non, Docker ne supporte pas ça.
Il faut bloquer le port en question dans le pare-feu, dans la chaîne iptables DOCKER-USER.
Pour bloquer l'accès au _registry_ Docker depuis l'extérieur par exemple :
~~~
# iptables -A DOCKER-USER -i eth0 -p tcp -m tcp --dport 5000 -j DROP
~~~
### Au sein des conteneurs, un `getent <service>` ou `getent tasks.<service>` ne retourne pas l'adresse IP du service alors que celui-ci est bien lancé.
Stopper le conteneur du service avec un `docker stop <conteneur du service>`. Docker stack devrait le relancer automatiquement.
### Comment obtenir l'adresse IP des _tasks_ d'un _service_ (dans le cadre de l'utilisation de Docker stack) au sein de conteneur (à des fins de debug) ?
L'adresse IP virtuelle qui redirige aléatoirement sur chacune des _tasks_ (si le réseau utilise le driver _overlay_, cas par défaut) :
~~~
$ getent hosts <nom du service>
~~~
L'adresse IP des différentes _tasks_ d'un service :
~~~
$ getent hosts tasks.<nom du service>
~~~
### Comment trouver le PID d'un processus roulant dans un conteneur ?
Docker et autres technologies de conteneurs, utilisent des namespace
linux pour isoler les processus. L’utilité pgrep(1) est capable
de filtrer les processus par namespace sur la base d’un autre
processus.
~~~
$ pgrep --ns $dockerPID $query
~~~
Ce concept provient du système Plan9
### Accéder au namespace réseau (ou autres) d'un conteneur
Docker ne met pas le namespace réseau qu'il utilise pour ses conteneurs dans `var/run/netns/`, on ne voit donc rien si on joue `ip netns` car le namespace est dans `/proc/${pid_conteneur}/ns/`.
On peut monter `/proc/${pid_conteneur}/ns/` dans `var/run/netns/` pour utiliser ip OU plus simplement utiliser nsenter à la place :
~~~bash
# nsenter -t $pid_conteneur -n
~~~
Nous permet d'avoir un shell dans le namespace, `-t` indique d'utiliser le pid target et `-n` indique que nous voulons aller dans le namespace netns
### Firewall (minifirewall) & Docker
Voir directement le [Howto Netfilter](/HowtoNetfilter#docker)
### Problème de résolution DNS dans Docker
En général on utilise une stack réseau distincte dans les conteneurs, et donc la résolution DNS dans les conteneurs
est assurée par « Docker DNS embedded server » qui va transférer aux serveurs DNS définis sur l'hôte.
Si les serveurs DNS de l'hôte fonctionnent bien mais que la résolution DNS ne se fait plus dans les conteneurs,
vous pouvez en désespoir de cause redémarrer le démon Docker.
### Redémarrer le démon Docker sans redémarrer les conteneurs ?
L'option `"live-restore"` à ne pas confondre avec le [RestartPolicy](#autostart-dun-conteneur) permet de redémarrer le démon Docker sans redémarrer les conteneurs
> **Important** On ne peut pas utiliser cette option pour les services de docker swarm.
Dans la configuration, si `grep "live-restore" /etc/docker/daemon.json` n'est pas à `"live-restore": true` on peut le mettre et reload docker `systemctl reload docker`
Après quoi on peut redémarrer le démon docker sans éteindre les conteneurs `systemctl restart docker`.
### Error response from daemon: rpc error: code = Unimplemented desc = unknown method ListServiceStatuses
Cette erreur peut arriver quand un noeud de la swarm est dans une version plus ancienne, différente de celle des autres noeuds
~~~
# docker node ls
xxxxxxxxxxxxxxx appxx Ready Active Leader 18.09.7
~~~
Il faut alors mettre à jour docker sur ce noeud.
### Operation not permitted
Si une application executée dans Docker génère des erreurs du style `Operation not permitted`, il est peut être necessaire de lancer le conteneur avec une (ou les deux) de ces options :
- `--security-opt seccomp=unconfined`
- `--security-opt apparmor=unconfined`
Par exemple, ça nous a déjà permis de corriger l'erreur suivante :
```
OpenBLAS blas_thread_init: pthread_create failed for thread 1 of 4: Operation not permitted
```
### Activer le userns-remap
[Documentation officielle sur userns-remap](https://docs.docker.com/engine/security/userns-remap/)
Cette option (que l'on active par défaut) permet de lancer les conteneurs avec des utilisateurs non priviligiés
qui sont des `subuid` de l'utilisateur `docker-remap`.
Cela permet d'éviter qu'un attaquant qui s'échappe du conteneur soit "root" sur l'hôte.
On active cela en mettant dans `/etc/docker/daemon.json` :
~~~
,"userns-remap": "default"
~~~
> Attention : si on active cette option il faudra relancer Docker qui va créer un nouveau dossier, par exemple `/var/lib/docker/1017504.1017504`, qui sera le nouveau chemin de stockage pour TOUS les conteneurs : les conteneurs existants devront donc etre recréés ou migrés.
Limitations :
- On ne peut plus utiliser `--pid=host` ou `--network=host` lorsqu'un conteneur est lancé
- On doit spécifier `--userns=host` pour utiliser l'option `--privileged`
Mais l'on peut toujours désactiver cette option au cas par cas, en lançant un conteneur avec l'option `--userns=host` ou avec l'option `userns_mode: "host"` dans Docker compose.
### Docker rootless
Encore mieux que de lancer les conteneur avec un utilisateur non priviligié avec le userns-remap, on peux lancer le démon docker avec un utilisateur non priviligié.
Le démon docker est lancé avec un [rootlesskit](https://github.com/rootless-containers/rootlesskit) dans un user-namespace :
* Le démon docker est piloté par une unitée systemd utilisateur, propre à chaque utilisateur.
* Les conteneur lancé ne seront evidemment pas lancé avec root, mais avec l'utilisateur
Avantages :
* On peut avoir plusieurs démons docker qui s'executent pour chacuns utilisateur ou l'unitée systemd est configuré ( en plus du démon de base qui peut lancer des conteneurs en root). Voir la section docker context pour voir comment manipuler plusieurs démons docker.
* La sécurité de l'hote, un attaquant qui s'echape du conteneur n'est par root sur l'hote.
Inconvénients :
* Les performances réseaux sont fortement degradé, il y a un workaround en béta pour l'instant : [bypass4netns](https://github.com/rootless-containers/bypass4netns)
* Comme docker tourne dans un namespace réseau, les ips de conteneurs docker (dans le bridge docker0 notamment) ne sont pas joignable depuis le namespace par défaut de l'hote, il faudra exposer les ports des conteneurs pour y acceder depuis l'hote.
[Documentation docker rootless](https://docs.docker.com/engine/security/rootless/)
Mise en place sur Debian 12 :
On peut mettre on place docker rootless sur un utilisateur non root, ici l'utilisateur rootless-docker est pris en exemple.
Prérequis :
* Il faut avoir installé docker normalement en suivant les etapes d'installation de ce wiki
* De préference, désactiver docker pour root `# systemctl disable --now docker.service`
* Installer les dépendances : `# apt install dbus-user-session fuse-overlayfs slirp4netns docker-ce-rootless-extras uidmap systemd-container`
* Permettre la persistence de la session utilisateur : `# loginctl enable-linger rootless-docker`
* Pour permettre au conteneur de ping : ajouter `net.ipv4.ping_group_range = 0 2147483647` dans `/etc/sysctl.conf` ou `/etc/sysctl.d/docker.conf` puis `# sysctl --system`
Intallation :
* **IMPORTANT** se connecter avec l'utilisateur via ssh ou via `# machinectl shell rootless-docker@`
* Jouer `dockerd-rootless-setuptool.sh install` la commande devrez nous donner l'emplacement de la socket, faire un export `export DOCKER_HOST=unix:///run/user/1001/docker.sock`
* Activer et lancer l'unitée systemd : `$ systemctl --user enable docker`, `$ systemctl --user start docker`
* Vérifir que docker tourne bien via systemd et `docker ps`
* Bonus : créer un docker context pour pouvoir interagir avec le démon sans se connecter à l'utisateur rootless-docker `# docker context create docker-rootless --docker "host=unix:///run/user/1001/docker.sock"`
Limitations :
* l'ip du conteneur donné dans docker inspect ne peut pas etre résolu car elle est propre au namespace du rootkit.
* Il faudra exposer des port < à 1024 à moins de changer le comportement de linux
### Permettre aux conteneurs d'accéder au service sur l'hote :
- C'est possible depuis docker 26 : <https://docs.docker.com/engine/release-notes/26.0/#new>
- slirp4netns : <https://github.com/rootless-containers/slirp4netns/blob/master/slirp4netns.1.md#filtering-connections>
Par défaut, slirp4netns (qui gére le namespace réseau) n'est pas configuré par docker-rootless pour permettre la communication avec localhost `127.0.0.1`
Pour permettre cela il faut configurer le démon docker avec une variable d'environnement (depuis l'utilisateur rootless) :
~~~
$ systemctl --user edit docker
[Service]
Environment=DOCKERD_ROOTLESS_ROOTLESSKIT_DISABLE_HOST_LOOPBACK=false
$ systemctl --user restart docker
~~~
Les conteneurs peuvent ensuite communiquer avec un service sur l'hote en utilisant l'ip `10.0.2.2` dans le conteneur.
> **Attention** cela permet aux conteneurs de communiquer avec n'importe que process en local (qui écoute sur l'hote dans le namespace réseaux par défaut).
Si on veut réduire plus finement les accés on peut utiliser socat ou un pair ethernet virtuel : <https://stackoverflow.com/questions/72500740/how-to-access-localhost-on-rootless-docker>
### Le conteneur produit des processus zombies
C'est parce que le point d’entrée du conteneur Docker (qui tourne en tant que PID 1 dans le PID namespace du conteneur) ne gère pas le fonctionnement spécial attendu du PID 1 sur un OS Unix-like.
Il faut démarrer les conteneurs avec l'argument `--init` de `docker` pour qu'un [init minimal](https://github.com/krallin/tini) soit inséré dans le container en tant que PID 1 avec l'entrypoint démarré comme PID 2.
> Le fonctionnement spécial attendu est décrit rapidement par [le README de `tini`](https://github.com/krallin/tini/blob/master/README.md) (le `init` de Docker) mais avec un peu plus de détails :
>
> - Le kernel ne fallback pas sur le comportement par défaut des signaux s'ils ne sont pas gérés explicitement par le processus (à l'exception de SIGKILL).
> - Les processus qui se terminent/meurent se retrouvent dans l'état "zombie" et doivent être `wait()` par leur parent. Si le parent se termine sans faire ça, le process devient "orphelin" et est déplacé pour avoir PID1 comme parent qui doit alors appelé `wait()` sur ce process.
>
> La vaste majorité des programmes utilisés comme entrypoint (notamment `sh`, `bash`, `npm` et `java`) ne gère pas ces particularités.
### Restriction générale des ressources de tous les containers
Il est possible de restreindre la consomation de ressources des containers docker d'un point de vue global. On va utiliser les slices de systemd dans ce but.
Exemple pour restreindre la mémoire utilisable par tous les containers à 4G :
~~~
# cat /etc/systemd/system/docker-limit-ressources.slice
[Unit]
Description=Slice with limits for Docker
Before=slices.target
[Slice]
MemoryAccounting=true
MemoryLimit=4096M
~~~
Puis on ajoutera la directive `cgroup-parent` dans le fichier `/etc/docker/daemon.json` avec le nom de notre slice : ex : `"cgroup-parent": "docker-limit-ressources.slice"`.
Pour appliquer les réglages, un coup de `systemctl daemon-reload` puis on peut redémarrer docker !
~~~
# systemctl daemon-reload
# systemctl restart docker
# systemctl status docker-limit-memory.slice
● docker-limit-ressources.slice - Slice with limits for Docker
Loaded: loaded (/etc/systemd/system/docker-limit-ressources.slice; static)
Active: active since Mon 2024-09-30 16:06:58 CEST; 2min 21s ago
Tasks: 43
Memory: 49.8M (limit: 50.0M available: 974.1M)
CPU: 7.799s
CGroup: /docker.slice/docker-limit.slice/docker-limit-memory.slice
├─docker-0ccd10fad70e7205b0bf4b8ec581ed5bd26cbd983632a1c6bf0ad66ada6d758a.scope
....
~~~