VIGILO NMS| Supervision de la performance

Client léger

Toutes les interfaces d'exploitation de Vigilo sont accessibles au travers d'un navigateur en client léger. Il n'y a pas de téléchargement d'applet Java ou autre module riche.

Supervision "Nagios"

Vigilo s'appuie sur la solution de supervision Nagios et offre donc toutes ses fonctionnalités. Au travers des agents Nagios, Vigilo peut donc utiliser tous les investissements réalisés sur ce type de solution. Vigilo profite aussi de tous les développements issus de la communauté autour de Nagios.

Scalabilité

Vigilo a été conçu pour gérer des parcs de moyenne à très grande taille. Il est ainsi possible de répartir automatiquement la charge sur plusieurs collecteurs et d'en consolider les informations en central.
La plus grande référence Vigilo est un établissement bancaire disposant de 10 000 agences et plus de 20 000 équipements. Cette capacité de montée en charge est gérée au travers d'une architecture distribuée constituée de multiples serveurs Nagios.

Architecture répartie

Suivant un principe similaire à celui présenté ci-dessus, Vigilo propose des fonctionnalités avancées de répartition géographique des serveurs de collecte. Ainsi on peut déployer un Vigilo local sur divers sites géographiques et consolider la supervision en un site central.

Modularité

Vigilo est conçu pour s'adapter au mieux à tout type d'architecture. Sa modularité permet de ne déployer que les modules nécessaires au sein de l'architecture.

Bus applicatif

Le système de communication entre les modules Vigilo s'appuie sur le protocole AMQP. Ce protocole ouvert, fiable et normalisé est en train de devenir le standard de la messagerie applicative open-source. Il offre de base de nombreuses fonctionnalités intéressantes :

  • Sécurisation des flux (SSL)
  • Possibilité de redondance (multi serveurs)
  • Possibilité d'abonnement sur le bus
  • Fonctionnalités de routage avancées
  • Répartition de charge des clients
  • Hétérogénéité des clients

Hypervision

Grâce au bus AMQP, Vigilo peut fonctionner en mode hypervision. Les spécificités de Vigilo pour gérer l’hypervision sont les suivantes :

  • Possibilité d’utiliser le bus Vigilo pour enregistrer les différents connecteurs
  • Capacité de construction et déploiement de configuration via des fichiers XML qui permet l’automatisation des configurations
  • Possibilité au niveau du bac à événements d'ajouter des colonnes pour différentier les différents superviseurs (par exemple)
  • Possibilité offerte par l’architecture de gérer des parcs de très grandes tailles

Supervision SNMP

Vigilo permet de superviser les équipements, systèmes et applicatifs dialoguant nativement en SNMP (V1, V2 et V3).
Par exemple: des routeurs Cisco, des systèmes UNIX (Solaris, HP-UX, AIX, BSD), Linux, Windows, AS400, équipements Nokia, etc. La version actuelle du collecteur SNMP Nagios permet de gérer des volumes importants de données en limitant le nombre de requêtes et donc l’impact réseau.

Traps SNMP

Un module complémentaire développé sur Nagios permet de traiter la remontée des traps SNMP.

Supervision locale, système et applicatif

Vigilo propose en complément de la supervision SNMP des agents spécifiques disponibles pour la majorité des environnements système et applicatif (Vigilo s'appuie pour cette partie sur l'existant Nagios et les nombreux plug-ins disponibles au sein de la communauté). Cette supervision est équivalente à la supervision SNMP. C'est le centre de supervision qui interroge les objets distants. Les flux transitent par le protocole Nagios (NRPE) ou via SSH et exécutent des scripts sur la machine distante.

Services métiers

CS a développé au sein du corrélateur un module dédié à la gestion des services métiers. Un service métier est défini comme une combinaison complexe d'indicateur de bas niveau auquel on associe des éléments de pondération. Ainsi, au lieu de suivre l'évolution d'une CPU, d'une carte réseau, etc. l'opérateur peut suivre la disponibilité du service de messagerie. Cette disponibilité incluant l'application serveur de messagerie, le serveur qui l'héberge, le commutateur sur lequel ce serveur est relié au réseau, etc. Les services métiers sont supervisables au sein du bac à événements et sur la cartographie. C'est un complément indispensable à la supervision des indicateurs bruts.

Supervision "passive"

Vigilo permet un mode de supervision passive (basé sur NSCA de Nagios) qui permet aux objets distants d'envoyer à leur convenance les informations vers le centre de supervision.

Supervision distante

Vigilo propose un mécanisme de supervision à distance sur les protocoles qui le permettent. Ainsi on va interroger régulièrement un serveur Web distant (par une requête HTTP) pour vérifier son bon fonctionnement. Ce mécanisme offre moins d'informations qu'un agent local mais permet un premier niveau de supervision sans déploiement d'agents sur les serveurs à superviser. Les services classiques supervisables par ce mode sont :

  • DNS
  • NTP
  • HTTP
  • LDAP
  • SMTP, IMAP et POP
  • MySQL, PostgreSQL, Oracle
  • Tout port TCP ou UDP

Métrologie

Vigilo offre des fonctionnalités de métrologie. Les informations de performances sont collectées et une interface permet d'accéder à de nombreux graphes. Il est possible de rechercher dans l'ensemble des données collectées, d'afficher les graphes correspondants, de les comparer entre eux, de zoomer, etc. Cette interface permet de faire de l'investigation mais aussi de l'analyse de tendance.

Moteur de corrélation

Sur un grand parc il est important de corréler les différents événements. Si deux serveurs sont derrière un routeur qui tombe en panne, il faut savoir associer la panne du routeur à la “non visibilité” des deux serveurs et ne pas alarmer les superviseurs sur l'état des serveurs. On peut aussi vouloir corréler des informations de supervision avec des informations extérieures. Ainsi une panne sur un routeur d'une agence fermée sera moins prioritaire qu'une même panne dans une agence ouverte. CS met régulièrement à jour son moteur de corrélation pour traiter les différentes demandes de nos clients. La dernière génération du moteur de corrélation utilise des règles en Python qui sont plus facilement personnalisables.

Bac à événements

Un module spécifique propose une interface de type “Bac à événements” pour la gestion de la supervision. Cette interface consiste en un tableau sur lequel s'affichent les incidents au fur et à mesure qu'ils sont détectés. Les opérateurs peuvent ensuite s'approprier ces événements pour les traiter puis les clore via un système de gestion de tickets d'incidents avec lequel le bac est interfacé.

Industrialisation de la configuration

La solution Vigilo est dessinée pour gérer des parcs de plusieurs milliers d'équipements. Pour ce faire, Vigilo s'appuie sur une architecture répartie composée de plusieurs serveurs de supervision. Un module dédié permet de gérer le déploiement automatique des configurations à partir du gestionnaire de configuration vers l'ensemble des serveurs.

Cartographie

Vigilo propose une interface de cartographie. Cette interface permet de regrouper les objets et de naviguer dans les groupes pour avoir une vision synthétique de l'état du système. A chaque icône de groupe sont associés des indicateurs de l'état du groupe et de ses membres.

Reporting

Vigilo propose un module de reporting pour la génération de rapports basé sur la suite JasperSoft. Ce module est complémentaire au module de métrologie qui est lui dédié davantage au suivi opérationnel et à la génération d'alertes. Le module de reporting propose en standard des rapports périodiques à destination des directions informatiques. Les rapports présentent des statistiques de performances sur des niveaux agrégés à la journée, au mois, ou à l'année, ou par site, par type d'équipement. Ce module permet également la génération de rapports complémentaires, à destination de profils spécifiques d'utilisateurs. Le module reporting est basé sur un ensemble de composants open-source dédiés à la génération de rapport. Cela lui octroie des facilités de personnalisation très fortes qui permettent au client lui-même de faire évoluer le contenu de ces rapports dans le temps.

Gestion et profils des utilisateurs

VigiAdmin offre des possibilités avancées de gestion des droits des utilisateurs qui permettent d’associer à un utilisateur ou un groupe d’utilisateurs un ensemble de fonctionnalités sur un périmètre précis du parc supervisé.