Zimbra - Snap disk at 100% - Disable Disk Space Monitoring for Loop Devices

Zimbra: /snap/core at 100% – Desactivar la monitorización del espacio en disco para los dispositivos de bucle

Hace poco entré en la cuenta de correo de administrador de un servidor de correo Zimbra que administro para ver si había algo notable que revisar. No es una cuenta en la que entre mucho, ya que normalmente sólo contiene informes diarios y notificaciones cuando se detienen o inician servicios.

¡Pues vaya sorpresa cuando de repente me encuentro con más de un millón de correos en la bandeja de entrada! ¡1.000.000! Y para mi sorpresa, el asunto del 99% de ellos era una variación de lo siguiente:

Disk /snap/core/13425 at 100% on mail.domain.com:
Disk /snap/certbot/2192 at 100% on mail.domain.com:
Disk /snap/canonical-livepatch/146 at 100% on mail.domain.com:
Disk /snap/core20/1518 at 100% on mail.domain.com:

Y el contenido de estos correos era básicamente una línea como las que sueles encontrar en los archivos de registro, como por ejemplo:

mail zimbramon[22102]: 22102:crit: Disk warning: mail.domain.com: /snap/canonical-livepatch/146 on device /dev/loop6 at 100%
mail zimbramon[22102]: 22102:crit: Disk warning: mail.domain.com: /snap/core/13425 on device /dev/loop3 at 100%

Qué causa este problema?

La causa es que Zimbra monitoriza los discos existentes y avisa cuando están llenos, pero estos discos /dev/loopX no tienen nada que ver con Zimbra y no necesitan ser monitorizados. Se crean automáticamente si tienes instalado snap y todos ellos son discos de sólo lectura. Puedes ver estos discos ejecutando el comando df -h:

root@mail:~# df -h
Filesystem                 Size  Used Avail Use% Mounted on
udev                       5.9G     0  5.9G   0% /dev
tmpfs                      1.2G  115M  1.1G  10% /run
/dev/mapper/mail--vg-root  245G  122G  111G  53% /
tmpfs                      5.9G     0  5.9G   0% /dev/shm
tmpfs                      5.0M     0  5.0M   0% /run/lock
tmpfs                      5.9G     0  5.9G   0% /sys/fs/cgroup
/dev/loop0                  64M   64M     0 100% /snap/core20/1738
/dev/loop1                 9.0M  9.0M     0 100% /snap/canonical-livepatch/164
/dev/loop3                 9.0M  9.0M     0 100% /snap/canonical-livepatch/146
/dev/loop2                  64M   64M     0 100% /snap/core20/1778
/dev/loop4                  45M   45M     0 100% /snap/certbot/2582
/dev/loop5                 117M  117M     0 100% /snap/core/14399
/dev/loop6                  45M   45M     0 100% /snap/certbot/2618
/dev/sda1                  720M  164M  520M  24% /boot
tmpfs                      1.2G     0  1.2G   0% /run/user/999
tmpfs                      1.2G     0  1.2G   0% /run/user/1000

Cómo arreglar este problema?

Como este problema no es crítico, pero la cantidad de correos electrónicos puede llegar a ser muy molesta muy rápidamente, lo mejor que puedes hacer es excluir todos estos dispositivos de bucle de la monitorización de Zimbra. Esto se puede conseguir ejecutando el siguiente comando como usuario de Zimbra (ejecuta su - zimbra como root):

zmlocalconfig -e zmstat_df_excludes='/dev/loop0:/dev/loop1:/dev/loop2:/dev/loop3:/dev/loop4:/dev/loop5:/dev/loop6'

Actualiza el comando con los dispositivos de bucle que veas en tu servidor. Después, reinicia los colectores de datos de estadísticas (stat data collectors) ejecutando:

zmstatctl restart

Consejo adicional

Al reiniciar el servidor o con el paso del tiempo, es posible que aparezcan nuevos/diferentes dispositivos de bucle y que vuelvan a llegar estos correos electrónicos de aviso. Si esto ocurre, simplemente ejecuta de nuevo los comandos anteriores actualizando la lista de dispositivos a excluir.

Zimbra Wiki: https://wiki.zimbra.com/wiki/Disable_Disk_Space_Monitoring_for_Loop_Devices