documentation_technique:supervision

Supervision

Description du système de supervision en place à Hadoly

Principe

Les machines sont supervisées par un Zabbix externe gracieusement mis à disposition par Thomas.

C'est une supervision en push ( ce sont les machines qui, à intervalle régulier, envoient différentes informations au serveur zabbix ), un service zabbix_agent a été déployé (par un rôle [ansible]) automatiquement sur chaque machine, entraînant sont enregistrement automatique auprès du serveur zabbix.

Configuration de l'agent

Elle se trouve dans /etc/zabbix.

Le fichier zabbix_agentd.conf concentre la configuration, à savoir l'adresse du serveur zabbix

À noter la présence de la directive hostmetadata permettant l'autoenregistrement de la machine auprès du serveur.

Dans le répertoire /etc/zabbix/zabbix_agentd.conf.d/ sont configurés des extensions pouvant être utilisées par les pollers zabbix pour récupérer des informations sur les disques, les points de montage, le serveur mysql. Ces extensions sont présentes sur toutes les machines mais pas forcément utilisées.

Pour surveiller mysql, il faut que l'utilisateur sous l'identité duquel tourne l'agent zabbix puisse s'y connecter:

Création d'un compte mysql dédié ( create user zabbix@localhost identified by '…' ) - un droit de connexion suffit.

Créer un répertoire personnel à zabbix (/var/lib/zabbix)

Créer dans ~zabbix un fichier .my.cnf lui permettant de se connecter à mysql de manière non interactive.

Accès à l'interface

Le serveur se trouve sur https://infra.opendoor.fr/zabbix

Le compte est hadoly, le mot de passe est 123Soleil (nan j'déconne).

Cette interface permet:

  • de voir ce qui va bien (ou pas) via le tableau de bord
  • de faire un peu de métrologie ( dernières données)
  • d'avoir un récap de toutes les alertes ( déclencheurs)

Ce qui est surveillé

Pour l'instant (2017-12) sont surveillés les éléments de base de chaque système: * charge cpu * mémoire * espace disque * nb de process * charge réseau * disponibilité du système

Les alertes

Chaque problème entraîne l'envoi d'une alerte: * SMS sur mon téléphone * mail vers Thomas, turlux et Bruno

  • documentation_technique/supervision.txt
  • Dernière modification: il y a 4 ans
  • de thomas