====== Supervision ====== Description du système de supervision en place à Hadoly ====== Principe ====== Les machines sont supervisées par un Zabbix externe gracieusement mis à disposition par Thomas. C'est une supervision en push ( ce sont les machines qui, à intervalle régulier, envoient différentes informations au serveur zabbix ), un service zabbix_agent a été déployé (par un rôle [ansible]) automatiquement sur chaque machine, entraînant sont enregistrement automatique auprès du serveur zabbix. ====== Configuration de l'agent ====== Elle se trouve dans /etc/zabbix. Le fichier zabbix_agentd.conf concentre la configuration, à savoir l'adresse du serveur zabbix À noter la présence de la directive //hostmetadata// permettant l'autoenregistrement de la machine auprès du serveur. Dans le répertoire ///etc/zabbix/zabbix_agentd.conf.d/// sont configurés des extensions pouvant être utilisées par les pollers zabbix pour récupérer des informations sur les disques, les points de montage, le serveur mysql. Ces extensions sont présentes sur toutes les machines mais pas forcément utilisées. ===== Cas particulier: mysql ===== Pour surveiller mysql, il faut que l'utilisateur sous l'identité duquel tourne l'agent zabbix puisse s'y connecter: Création d'un compte mysql dédié ( create user zabbix@localhost identified by '...' ) - un droit de connexion suffit. Créer un répertoire personnel à zabbix (/var/lib/zabbix) Créer dans ~zabbix un fichier .my.cnf lui permettant de se connecter à mysql de manière non interactive. ====== Accès à l'interface ====== Le serveur se trouve sur https:%%//%%infra.opendoor.fr/zabbix Le compte est hadoly, le mot de passe est 123Soleil (nan j'déconne). Cette interface permet: * de voir ce qui va bien (ou pas) via le //tableau de bord// * de faire un peu de métrologie ( //dernières données//) * d'avoir un récap de toutes les alertes ( //déclencheurs//) ====== Ce qui est surveillé ====== Pour l'instant (2017-12) sont surveillés les éléments de base de chaque système: * charge cpu * mémoire * espace disque * nb de process * charge réseau * disponibilité du système ===== Services spécifiques surveillés: ===== * [[documentation_technique:machines:demetra]] : surveillance port udp 53 * [[documentation_technique:machines:merlin]] : surveillance port 443 * [[documentation_technique:machines:etherpad]] : surveillance processe node / ether * [[documentation_technique:machines:gauvain]] : service imap * [[documentation_technique:machines:guetenoch]] : mysql et apache * [[documentation_technique:machines:karadoc]] : rien de special, la dispo de chaque container étant monitoré individuellement * [[documentation_technique:machines:leodagan]] : ldap et ldaps * [[documentation_technique:machines:perceval]] : named port udp 53 * [[documentation_technique:machines:tavernier]] : http et https * [[documentation_technique:machines:yvain]] : smtp service ====== Les alertes ====== Chaque problème entraîne l'envoi d'une alerte: * SMS sur mon téléphone * mail vers Thomas, turlux et Bruno