Conteneurs - systemd

De Wiki doc

Systemd permet d'exécuter des conteneurs système à la manière de LXC. L'avantage de cette solution est qu'elle est extrêmement simple et rapide à mettre en œuvre, ce qui en fait une option de choix pour faire des tests sans prises de tête ou conteneuriser une production.

Il existe deux façons de procéder :

  1. Systemd-nspawn, réalise une exécution simple, manuelle et sans possibilité de quitter le conteneur (il ne rend pas la main et doit être terminé pour cela). Le principal intérêt est selon moi, le test rapide et l'expérimentation de paramètres.
  2. Machinectl, s'apparente plus à LXC (il est pour Nspawn ce qu'est Libvirt pour Qemu) en proposant, notamment, un démarrage automatique configurable des conteneurs avec le système ainsi qu'un attachement/détachement à leur console. La production est envisageable avec cette méthode.

INFORMATION

Une grande partie de cette page est issue de cet article source que je vous encourage à consulter.

Systemd-nspawn

Installation

Installation des paquets

apt install --no-install-recommends debootstrap systemd-container debian-archive-keyring

Note: seul systemd-container est nécessaire au fonctionnement des conteneurs.

Création d'un répertoire d'accueil

mkdir -p ~/conteneurs && cd $_

Importation d'une racine Debian pour le système du conteneur

debootstrap --arch amd64 --include=systemd-container buster modèle.buster http://deb.debian.org/debian/

le paramètre --include=systemd-container permet d'installer ledit paquet dans le système invité (au passage, ce paquet doit être présent dans le conteneur pour pouvoir être utilisé avec la fonction login de Machinectl). Vous pouvez en préciser plusieurs en les séparent par des virgules.

ATTENTION

Si la commande vous renvoie un message du genre:
/usr/sbin/debootstrap: 1578: /usr/sbin/debootstrap: cannot create /tmp/conteneurs/modèle.buster/test-dev-null: Permission denied
E: Cannot install into target '/tmp/conteneurs/modèle.buster' mounted with noexec or nodev

c'est que le système de fichiers cible ne supporte pas l'exécution de binaires (ce serai le cas de certains d'entre eux dans un volume Luks non root). Là en l’occurrence c'est par ce que mon /tmp est un tmpfs (mais on va partir du principe qu'il s'agit d'un /home/toto). Pour corriger cela, il faut remonter le système de fichier avec les bons paramètres: mount -i -o remount,exec,dev /home/toto.

Note: Vous pouvez utiliser ce système comme un modèle que vous copierez afin de faire un nouveau conteneur. Cette pratique est plus rapide si vous n'avez pas de miroir de dépôt local mais n'oubliez pas de mettre à jour le système après la copie (si votre modèle est vieux).

Se connecter au conteneur sans le démarrer (identique à un chroot)

systemd-nspawn -D modèle.buster

Si vous rencontrez une impossibilité de vous connecter au shell de votre conteneur par la suite, il faudra supprimer le fichier de liste blanche des TTY autorisés pour la connexion (/etc/securetty) afin de permettre l'authentification comme suit:

rm /etc/securetty

On assignera enfin un mot de passe root et supprimera l'historique Bash avant de quitter le conteneur.

passwd
history -c
<ctrl+d>

Copie du modèle

cp -a modèle.buster buster1

Démarrer le conteneur et s'y connecter

systemd-nspawn -bD buster1

Il n'est pas possible de se détacher du conteneur avec cette méthode (pour cela, il faudra se tourner vers Machinectl). Pour sortir, il faut soit éteindre le conteneur (via les commandes habituelles), soit le terminer par la force via la répétition successive de trois fois la combinaison de touches suivante: <ctrl> + ].

Paramétrage

Pour aller plus loin, il est possible de passer un ensemble de paramètres via un fichier de configuration propre au conteneur ainsi qu'à la ligne de démarrage précédente (les deux modes de configuration peuvent être combinés) afin d'affiner l'usage du conteneur. Je vous recommande la lecture des pages de manuel (très bien faites) cités en sources au bas de la page.

Réseau

Avec la commande précédente, le conteneur va se lancer avec l'ensemble des interfaces réseaux de l'hôte, ce qui peux s'avérer utiles dans les cas où l'on veut proposer un service à un ensemble de VLAN sans routage par exemple ou pour exécuter une application comme depuis l'hôte.

Cependant, si l'on veut que notre conteneur soit limité à un ou plusieurs réseaux, il existe une section dédiée dans le manuel. J'affectionne tout particulièrement l'usage de --network-interface qui permet de déplacer une interface veth dans l'espace de nom réseau du conteneur (ces interfaces doivent au préalable être créées). Ce paramètre peut être utilisé plusieurs fois afin de mettre notre système invité dans plusieurs VLAN par exemple:

# Allumage de l'interface servant les services des conteneurs (reliée à un commutateur matériel)
ip link set eth2 up

# Création du pont avec gestion du 802.1Q
ip link add br0 type bridge vlan_filtering 1
ip link set br0 up

# Ajout de l'interface physique au pont
ip link set eth2 master br0

# Désactivation du VLAN par défaut sur le pont afin de l'isoler
bridge vlan del dev br0 vid 1 self
bridge vlan del dev eth2 vid 1 master

### Création et configuration des interfaces VLAN ###
# Interface vlan 180
ip link add link br0 name vlan180 type vlan id 180
ip link set vlan180 up
ip address add 2001:db8:0:180::1/64 dev vlan180
bridge vlan add dev br0 vid 180 tagged self
bridge vlan add dev eth2 vid 180 tagged master

# Interface vlan 181
ip link add link br0 name vlan181 type vlan id 181
ip link set vlan181 up
ip address add 2001:db8:0:181::1/64 dev vlan181
bridge vlan add dev br0 vid 181 tagged self
bridge vlan add dev eth2 vid 181 tagged master
######

# Création du couple de VETH pour interfacer mon conteneur "apache" avec le VLAN 180
ip link add apache180_c type veth peer name apache180_h
ip link set apache180_h up
ip link set apache180_h master br0
bridge vlan del dev apache180_h vid 1 PVID untagged master
bridge vlan add dev apache180_h vid 180 pvid untagged master

# Création du couple de VETH pour interfacer mon conteneur "apache" avec le VLAN 181
ip link add apache181_c type veth peer name apache181_h
ip link set apache181_h up
ip link set apache181_h master br0
bridge vlan del dev apache181_h vid 1 PVID untagged master
bridge vlan add dev apache181_h vid 181 pvid untagged master

# Démarrage de mon conteneur apache
systemd-nspawn -b --network-interface=apache180_c --network-interface=apache181_c -D /root/conteneurs/apache

Le réseau dans mon conteneur est définit comme suit:

vim /root/conteneurs/apache/etc/network/interfaces
auto lo
iface lo inet loopback
        up /usr/local/bin/confint
vim /root/conteneurs/apache/usr/local/bin/confint
#!/bin/bash

# Configuration des interfaces
ip addr add fd00:0:0:180::a0/64 dev apache180_c
ip link set apache180_c up

ip addr add fd00:0:0:181::a0/64 dev apache181_c
ip link set apache181_c up
chmod u+x /root/conteneurs/apache/usr/local/bin/confint

Éphémérité

Il est également possible de lancer le conteneur en mode éphémère via un instantané (avec BTRFS ou XFS) ou via une copie liée reflinks (avec EXT4) en utilisant le paramètre -x. Ceci offre une liberté non négligeable pour vos tests vous puisque vous pouvez tout péter, une extinction supprimera l'instantané et votre conteneur n'aura pas été modifié d'un bit. Cerise sur le gâteau, un redémarrage du conteneur éphémère ne supprime pas cet instantané donc vous pouvez même tester des applications nécessitant un redémarrage contrairement aux Squashfs !

Encore plus fou, il est possible de conteneuriser son propre système alors qu'il est lui-même démarré !

systemd-nspawn -bxD /

Lorsque le conteneur est utilisé avec un fichier de configuration, la journalisation doit être désactivée pour pouvoir le démarrer en mode éphémère. Les paramètres de configuration sont :

LinkJournal=no
Ephemeral=on

À mettre dans la section [Exec].

Montage

Il est possible de monter des arborescences dans les conteneurs directement depuis la ligne de commande. Dans le cas d'un usage de ces notions dans un fichier de configuration, ces paramètres sont à placer dans la section [Files].

Les options sont combinables.

Montage lié

L'outil permet de copier le comportement d'un mount --bind via le paramètre --bind. En voici un exemple :

mkdir -p /tmp/toto/{titi,tata/{tutu,tyty}}
systemd-nspawn --bind=/tmp/toto:/mnt -bxD /root/conteneurs/apache/

Ceci aura pour effet de monter le contenu du répertoire /tmp/toto/ de l'hôte dans le répertoire /mnt/ de l'invité (en cas d'omission de ce dernier paramètre, le répertoire sera monté dans le même que l'hôte).

Le paramètre de configuration est Bind=/tmp/toto:/mnt (section [Files]).

ASTUCE

Il est également possible de passer un fichier (régulier, spécial, bloc...) à un conteneur via cette méthode.

Montage tmpfs

Il est possible de monter un tmpfs dans le conteneur afin de disposer d'un ramdisk. Après les :, les paramètres sont les même que pour un tmpfs traditionnel.

systemd-nspawn --tmpfs=/tmp/ramdisk:rw,size=2G -bxD /root/conteneurs/apache/

Le répertoire /tmp/ramdisk est monté dans l'invité en tmpfs en lecture/écriture et limité à 2Go.

Le paramètre de configuration est TemporaryFileSystem=/tmp/ramdisk:rw,size=2G (section [Files]).

Montage superposé

Un ou plusieurs montages superposés (overlay) peuvent être ajoutés. Le premier répertoire sert de base en lecture seule et le second enregistre les modifications tandis que le troisième sera le point de montage final (son omission présente la même arborescence que l'hôte).

mkdir -p /tmp/{ycharbi/{1,2,3/{3.1,3.2}},lesmorin}
systemd-nspawn --overlay=/tmp/ycharbi:/tmp/lesmorin:/toto -bxD /root/conteneurs/apache/

Le paramètre de configuration est Overlay=/tmp/ycharbi:/tmp/lesmorin:/toto (section [Files]).

Non privilégié

Un conteneur Nspawn peut-être exécuté dans un espace de noms utilisateur afin de cloisonner les privilèges du root invité (cela rend encore plus compliqué le piratage du système puisque en plus d'exploiter une faille pour sortir du conteneur, l'attaquant devra également user d'une élévation de privilèges pour nuire) via le paramètre -U.

Tout cumulé, on en arrive à la commande suivante :

systemd-nspawn -b --network-interface=apache_c -xUD /root/conteneurs/apache

Le paramètre de configuration est PrivateUsers=pick (section [Exec]).

Fichier de configuration

Pour chaque conteneurs démarrés, Systemd-nspawn va regarder le contenu des fichiers de configuration présents dans les répertoires suivants (qui n'existent pas forcément, il suffit de créer celui qui vous chante) :

  • /etc/systemd/nspawn/machine.nspawn
  • /run/systemd/nspawn/machine.nspawn
  • /var/lib/machines/machine.nspawn


Vous pouvez donc définir des configurations personnalisées pour chacun des conteneurs que vous exécuterez afin d'alléger leur commande de démarrage (le nom du fichier doit être identique au nom du conteneur). La syntaxe est documenté dans le manuel dédié. Ces fichiers sont bien entendus également utilisés par Machinectl. Vous pouvez donc paramétrer vos conteneurs gérés par cet outil.

Par exemple, un fichier de configuration correspondant à cette ligne de commande: systemd-nspawn -b --network-interface=apache180_c --network-interface=apache181_c -D /root/conteneurs/apache est le suivant (/etc/systemd/nspawn/apache.nspawn) :

[Exec]
Boot=on

[Network]
Interface=apache180_c
Interface=apache181_c

Il est à noté que les paramètres sont à mettre sous les bonnes sections comme dans un service Systemd. Faites-y attention lors de la lecture du manuel.

ATTENTION

Nous avons constaté un bogue dans le cas de l'utilisation d'une option de montage (le Bind= dans notre cas) avec l'option -x de systemd-nspawn (le montage ne se fait pas et aucune erreur ne se produit). Si vous voulez effectuer ce type de montage sur un conteneur éphémère, il faut préciser le paramètre dans le fichier de configuration comme ceci: Ephemeral=on sous la section [Exec].

Machinectl

Cet outil ressemble plus à la gestion traditionnelle d'un LXC. Il se base sur Systemd-nspawn (c'est lui qui est appelé en arrière plan) et travail exclusivement dans le répertoire /var/lib/machines (là où Systemd-nspawn s'adaptait au paramètre passé).

Mise en œuvre

Création d'un conteneur Debian Sid en amd64 avec les branches de dépôt main, contrib et non-free s'appelant "sid1" et comportant le paquet supplémentaire systemd-container :

apt install --no-install-recommends debootstrap systemd-container debian-archive-keyring
debootstrap --arch amd64 --include=systemd-container --components=main,contrib,non-free sid /var/lib/machines/sid http://deb.debian.org/debian/
machinectl clone sid sid1
machinectl start sid1
machinectl shell sid1

Note: Vous pouvez sinon tout bêtement copier votre conteneur précédent: cp -a /root/conteneurs/buster1 /var/lib/machines/.

Lors de l'exécution d'un conteneur par l'outil, le modèle de service /lib/systemd/system/systemd-nspawn@.service est utilisé. Ce dernier passe un ensemble de paramètres à la commande systemd-nspawn (qui lance réellement le conteneur, machinectl n'étant qu'une interface de gestion), dont le -U (utilisateur non privilégié), qui peut se retrouver bloquant pour certaines tâches. Si vous voulez outrepasser cette option, il faut spécifier l'usage du mode privilégié dans le fichier de configuration propre au conteneur avec le paramètre PrivateUsers=0 (section [Exec]).

Commandes utiles

Voici les commandes utiles :

Argument Signification
machinectl ou machinectl list Liste les conteneurs actifs
machinectl list-images Liste les conteneurs sans distinctions
machinectl start sid1 Démarre le conteneur et rend la main (il se comporte comme un service)
machinectl poweroff sid1 ou machinectl stop sid1 Éteint le conteneur sid1 proprement, stop est un alias de poweroff
machinectl terminate sid1 Tue le conteneur (force l'arrêt)
machinectl clone sid sid1 Copie le conteneur (un cp -a /var/lib/machines/conteneur_source /var/lib/machines/conteneur_destination fait la même chose)
machinectl remove sid1 Supprime le conteneur (un rm -rf /var/lib/machines/conteneur_source conteneur_destination fait la même chose si tant est qu'il est bien arrêté)
machinectl clean --all Supprime tout les conteneurs
machinectl login sid1 Attache un conteneur en passant par l'outil de connexion du système (pour sortir, il faut utiliser la répétition successive de trois fois la combinaison de touches suivante: <ctrl> + ])
machinectl shell sid1 Se connecte automatiquement au conteneur sans demander de mot de passe (identique à un chroot ou un su - utilisateur depuis root). Pour sortir, il faut faire un exit ou <ctrl> + d
machinectl enable sid1 Ajoute le conteneur au démarrage système. Cela créer un lien symbolique de /lib/systemd/system/systemd-nspawn@.service dans /etc/systemd/system/machines.target.wants/
machinectl disable sid1 Enlève le conteneur du démarrage système
machinectl copy-to sid1 ~/Documents/proc.jpeg /root/image.jpg Copie un fichier dans le conteneur (la syntaxe pour un dossier est identique sans paramètres supplémentaires). Est identique à une copie standard mais part de la racine du conteneur
machinectl copy-from sid1 /root/xyz abc Même chose dans l'autre sens. Permet de récupérer un fichier/dossier
machinectl export-tar sid1 /tmp/sid1.tar.gz Réalise une sauvegarde du conteneur sous forme d'archive compressée (tar.gz)
machinectl import-tar /tmp/sid1.tar.gz sid2 Importe un conteneur précédemment sauvegardé. En dehors des deux dernières commandes, ces opérations sont réalisables manuellement via les commandes standards.

Utiliser fuse

Dans un conteneur non privilégié, l'utilisation du module noyau fuse n'est pas autorisé.

Pour le permettre, il faut ajouter le paramètre suivant dans le fichier de configuration du conteneur (/etc/systemd/nspawn/monConteneur.nspawn pour l'exemple) :

[Files]
Bind=/dev/fuse

Il convient ensuite d'affecter la propriété s'y afférent au service du conteneur avec la commande suivante :

systemctl set-property systemd-nspawn@monConteneur DeviceAllow='/dev/fuse rwm'

INFORMATION

Ceci va jouter la ligne DeviceAllow=/dev/fuse rwm au fichier /etc/systemd/system.control/systemd-nspawn@monConteneur.service.d/50-DeviceAllow.conf qui est concaténé à la volée au service /etc/systemd/system/machines.target.wants/systemd-nspawn@monConteneur.service (fichier à ne pas éditer à la main - utiliser systemctl edit systemd-nspawn@monConteneur.service si une modification est à apporter, ce qui créera /etc/systemd/system/systemd-nspawn@monConteneur.service.d/override.conf).

Sources