Articles

10 Meilleurs outils de surveillance Linux Open Source pour 2021

Vous pouvez nous soutenir en téléchargeant cet article au format PDF à partir du lien ci-dessous. Téléchargez le guide au format PDF

Chaque organisation qui utilise la puissance de la technologie s’efforce de savoir comment se portent ses systèmes informatiques et les applications qui s’y exécutent. Être capable de savoir quand quelque chose ne se passe pas comme prévu peut vraiment augmenter les performances et réduire le temps de dépannage des anomalies. Pour y parvenir, il existe des outils qui doivent être votre meilleur ami car ils vous aideront dans cette quête prudente. À cette fin, nous pouvons donc utiliser un certain nombre d’outils pour rassembler et traiter ce qui se passe à l’intérieur de votre équipement réseau et de vos serveurs (physiques ou virtuels).

Nous allons explorer les meilleurs outils de surveillance Open Source que vous pouvez utiliser dans votre infrastructure pour vous tenir au courant de l’état de votre infrastructure.

LibreNMS

LibreNMS est une surveillance de réseau basée sur PHP / MySQL / SNMP à découverte automatique qui prend en charge un large éventail de matériels réseau et de systèmes d’exploitation, notamment Cisco, Linux, FreeBSD, Juniper, Brocade, Foundry, HP et bien d’autres. Il est le mieux adapté aux périphériques réseau et aux serveurs.

Caractéristiques de LibreNMS

Ce qui est cool avec libreNMS, c’est le fait qu’il se découvre automatiquement. Vous n’avez pas à lui dire si votre appareil est basé sur Cisco, Juniper, Windows ou Linux. Il rassemble automatiquement ces informations comme un charme en utilisant des protocoles tels que CDP, FDP, LLDP, OSPF, BGP, SNMP et ARP.

Il fait un effort supplémentaire et découvre les interfaces sur votre routeur ou votre commutateur, ce qui est assez impressionnant. Il tente également de dessiner les détails de connexion de votre réseau mais nécessite de l’aide de votre part.

Alertes

Comme la plupart des outils de surveillance, libreNMS dispose également de la fonctionnalité de surveillance qui peut être hautement personnalisée.

Il peut évoluer

À mesure que votre réseau se développe, sa fonction d’interrogation distribuée permet une mise à l’échelle horizontale de votre système.
LibreNMS dispose d’un système de facturation. Oui, cet outil en a un. Cela peut être fait par la génération de factures de bande passante pour les ports de votre réseau en fonction de l’utilisation ou du transfert.

Applications mobiles

LibreNMS dispose d’applications Android et Apple qui peuvent être utilisées pour afficher et gérer votre réseau. C’est une telle bouffée d’air frais.
Prise en charge ou divers mécanismes d’authentification tels que radius, LDAP, Active Directory et plus encore.

Système de facturation

Générez des factures de bande passante pour les ports de votre réseau en fonction de l’utilisation ou du transfert.

Intégration API

Vous pouvez l’intégrer dans n’importe quel autre système via son accès API.
Cet outil est une bête et nous vous encourageons donc à regarder ce qui se passe à l’intérieur de son moteur. Il y a beaucoup plus que ce que l’article peut révéler, y compris la sécurité grâce aux guides d’installation

:

Comment Installer LibreNMS sur CentOS 8 / RHEL 8

Comment Installer et configurer LibreNMS sur Ubuntu avec Nginx

Installez l’outil de surveillance LibreNMS sur CentOS 7 avec Letsencrypt et Nginx

Nagios

De Nagios.org,  » Nagios surveille l’ensemble de votre infrastructure informatique pour s’assurer que les systèmes, les applications, les services et les processus métier fonctionnent correctement. En cas de panne, Nagios peut alerter le personnel technique du problème, ce qui lui permet de commencer les processus de correction avant que les pannes n’affectent les processus métier, les utilisateurs finaux ou les clients. »

C’est un outil qui a commencé en 1999 et qui s’est développé pour inclure d’autres produits actuellement, mais tous axés sur la surveillance. Jetons un coup d’œil aux fonctionnalités qu’il a pour votre considération.

Surveillance d’un grand nombre d’appareils

Nagios a les capacités de surveiller les applications, les services, les systèmes d’exploitation, les protocoles réseau, les métriques système et les composants d’infrastructure avec un seul outil. Cela en fait un touche-à-tout, ce qui peut être très bénéfique si vous souhaitez qu’un outil couvre un large éventail de services et d’appareils.

Multi-location

Avoir de nombreux utilisateurs connectés simultanément à l’interface augmente l’efficacité et améliore même votre entreprise puisque les parties prenantes intéressées peuvent avoir un aperçu en temps réel de l’état de l’infrastructure. Il peut également limiter les vues au seul réseau spécifique à l’utilisateur et donc en accueillir plus sur une seule plate-forme. Vous ne pouvez voir que ce qui vous appartient.

Reporting

Nagios garantit que les accords de niveau de service sont respectés en produisant des rapports qui peuvent être améliorés par des plugins de fournisseurs tiers. Cela le rend très flexible et personnalisable.

Visibilité

Avec une interface Web centralisée où vous pouvez tout voir, il peut être facile de détecter les pannes.

Notifications

Nagios dispose d’une fonctionnalité d’alerte. Les alertes peuvent être envoyées par SMS et mail ce qui se traduit par une gestion simplifiée de votre infrastructure.

Une caractéristique intéressante de Nagios est la façon dont les gestionnaires d’événements permettent le redémarrage automatique des applications et services défaillants.

Guides d’installation:

Installez et configurez Nagios 4 sur RHEL 8/CentOS

Zabbix

Depuis son site, « Zabbix est le logiciel d’entreprise ultime conçu pour la surveillance en temps réel de millions de métriques collectées à partir de dizaines de milliers de serveurs, de machines virtuelles et de périphériques réseau. »Il est capable de surveiller non seulement Linux mais aussi Windows, Solaris, IBM AIX. Il a les capacités de surveiller les applications, les services, les bases de données et bien plus encore.

Zabbix contient de nombreuses fonctionnalités et nous les examinerons en un mot.

Surveille n’importe quoi

Solutions pour tout type d’infrastructure informatique, services, applications, ressources –

Agent Zabbix de nouvelle génération

Zabbix 4.4 introduit un nouveau type d’agent, zabbix_agent2, qui offre un large éventail de nouvelles capacités et de fonctions de surveillance avancées

Collection de métriques

Il dispose de diverses méthodes permettant de collecter les métriques souhaitées, y compris l’agent Zabbix multi-plateforme

  • (L’agent Zabbix peut fonctionner sur diverses plates-formes prises en charge, notamment Linux, UNIX et Windows, et collecter des données telles que l’utilisation du processeur, de la mémoire, du disque et de l’interface réseau à partir d’un périphérique.),
  • Agents SNMP et IPMI
  • Surveillance sans agent des services utilisateurs
  • Méthodes personnalisées
  • Calcul et agrégation et surveillance web de l’utilisateur final

Détection d’anomalies dans votre configuration

Zabbix est capable de détecter automatiquement les états problématiques dans le flux de métriques entrant à l’aide de seuils intelligents définis

Meilleure présentation de visualisation

Selon Développeurs Zabbix, l’interface offre à ses utilisateurs de multiples façons de présenter un aperçu visuel de votre infrastructure et de votre environnement. Ceux-ci peuvent prendre la forme de tableaux de bord, de graphiques, de cartes réseau et de diaporamas basés sur des widgets.

Notifications

Le serveur peut envoyer des messages ou du courrier. Beaucoup plus peut être fait en ce qui concerne les alertes. Par exemple, les messages peuvent être personnalisés en fonction du rôle du destinataire ou avec des informations d’exécution et d’inventaire. De plus, les messages peuvent être configurés pour se concentrer sur les causes profondes du problème résultant à l’aide du mécanisme de corrélation d’événements Zabbix.
L’utilisation de modèles: Cette fonctionnalité vous permet d’utiliser des modèles prêts à l’emploi pour la plupart des plates-formes populaires et de surveiller des milliers de périphériques similaires en utilisant des modèles de configuration

Évolutivité

Zabbix utilise des proxys qui envoient des informations collectées dans l’environnement dans lequel il se trouve dans un serveur Zabbix central. L’utilisation de proxys Zabbix peut grandement simplifier la maintenance d’un environnement surveillé par Zabbix et augmenter les performances du serveur Zabbix central. Cela montre comment le système de surveillance peut évoluer de manière distribuée. Zabbix dispose d’une API et peut donc être utilisé pour l’intégrer dans n’importe quel système de l’infrastructure.

Support officiel de TimescaleDB

Guides d’installation:

Comment Installer le Serveur Zabbix 5 sur Debian 10 Buster

Comment Installer le Serveur Zabbix sur CentOS 8 / RHEL 8

Comment Installer le Serveur Zabbix 5.0 sur CentOS 7

Comment Installer le Serveur Zabbix 5.0 sur Ubuntu

Prometheus

Selon la page Prometheus GitHub, il s’agit d’un projet Cloud Native Computing Foundation qui surveille les systèmes et les services. Il collecte les métriques des cibles configurées à des intervalles donnés, évalue les expressions de règles, affiche les résultats et peut déclencher des alertes si une condition est observée comme vraie.
Il convient à la fois à la surveillance centrée sur la machine et à la surveillance d’architectures orientées services hautement dynamiques. Pour les visualisations graphiques, Prometheus prend en charge des outils tels que Grafana pour la visualisation et l’exportation de données.

Principales caractéristiques de Prometheus

  • Il s’agit d’un modèle de données multidimensionnel (séries temporelles définies par le nom de la métrique et un ensemble de dimensions clé/valeur)
  • Un langage de requête flexible pour tirer parti de cette dimensionnalité
  • Ne dépend pas du stockage distribué; les nœuds de serveur unique sont autonomes
  • La collecte de séries temporelles se fait via un modèle d’extraction sur HTTP
  • La poussée de séries temporelles est prise en charge via une passerelle intermédiaire
  • Les cibles sont découvertes via la découverte de services ou la configuration statique
  • Plusieurs modes de prise en charge de graphiques et de tableaux de bord
  • Prise en charge de la fédération hiérarchique et horizontale

Guides d’installation :

Installer le serveur Prometheus sur Debian 10/9 &Ubuntu 20.04/18.04

Installez le serveur Prometheus sur CentOS 7 / Ubuntu 18.04

Comment installer Prometheus et node_exporter sur Debian 10 (Buster)

Netdata

Depuis leur page GitHub, Netdata est distribué, en temps réel, suivi des performances et de la santé des systèmes et des applications. C’est un agent de surveillance hautement optimisé que vous installez sur tous vos systèmes et conteneurs. Il fournit des informations inégalées, en temps réel, sur tout ce qui se passe sur les systèmes qu’il exécute (y compris les serveurs Web, les bases de données, les applications), à l’aide de tableaux de bord Web hautement interactifs. Une autre fonctionnalité intéressante de Netdata est qu’il peut fonctionner de manière autonome, sans composants tiers, ou qu’il peut être intégré dans des chaînes d’outils de surveillance existantes telles que Prometheus, Graphite, OpenTSDB, Kafka, Grafana et autres.

Netdata est un agent de surveillance que vous installez sur tous vos systèmes. C’est:

  • Un collecteur de métriques – pour les métriques système et applicatives (y compris les serveurs Web, les bases de données, les conteneurs, etc.)
  • Une base de données de séries chronologiques – toutes stockées en mémoire (ne touche pas les disques pendant son exécution)
  • Un visualiseur de métriques – super rapide, interactif, moderne, optimisé pour la détection des anomalies
  • Un moteur de notification d’alarmes – un chien de garde avancé pour détecter les problèmes de performance et de disponibilité

Caractéristiques de Netdata

  • 1s – la résolution la plus élevée possible pour toutes les métriques.
  • Métriques illimitées – collecte toutes les métriques disponibles, plus il y en a, mieux c’est.
  • 1% d’utilisation du processeur d’un seul cœur – il est super rapide, incroyablement optimisé.
  • Quelques Mo de RAM – par défaut, il utilise 25 Mo de RAM. Vous le dimensionnez.
  • Zero disk I / O – pendant son exécution, il ne charge ni n’enregistre rien (sauf les journaux d’erreur et d’accès).
  • Configuration zéro – détecte automatiquement tout, il peut collecter jusqu’à 10000 métriques par serveur prêtes à l’emploi.
  • Zéro maintenance – Il suffit de l’exécuter, il fait le reste.
  • Zéro dépendance – c’est même son propre serveur web, pour ses fichiers web statiques et son API web.
  • Évolue à l’infini – vous pouvez l’installer sur tous vos serveurs, conteneurs, machines virtuelles et IoT.
  • Plusieurs modes de fonctionnement – Surveillance autonome de l’hôte (par défaut), collecteur de données sans tête, proxy de transfert, proxy de stockage et de transfert, surveillance centrale multi-hôte
  • Surveillance de la santé &Alarmes

    Alertes sophistiquées – livré avec des centaines d’alarmes, prêtes à l’emploi!
    Notifications: Que vous utilisiez Telegram, Twilio, Email, kavenegar, messagebird et d’autres, vous êtes couvert.

    Visualisation

    • De superbes tableaux de bord interactifs – souris, pavé tactile et écran tactile conviviaux pour les thèmes sombres et blancs
    • Visualisation incroyablement rapide – répond à toutes les requêtes en moins de 1 ms par métrique, même sur du matériel bas de gamme.
    • Personnalisable – les tableaux de bord personnalisés peuvent être créés en utilisant du HTML simple (pas de javascript nécessaire).
    • Intégrable – ses graphiques peuvent être intégrés à vos pages Web, wikis et blogs.

    Ce qu’il surveille

    La collecte de données Netdata est extensible – vous pouvez surveiller tout ce pour quoi vous pouvez obtenir une métrique. APM (Surveillance des Performances des Applications), Ressources Système, Disques, Systèmes de fichiers, Réseaux, Serveurs DNS, Réseaux Privés Virtuels, Mandataires, Équilibreurs, Accélérateurs.

    Guides d’installation:

    Comment Installer Netdata sur RHEL 8/CentOS 8

    Comment Installer Netdata sur FreeBSD 12

    Installation de netdata sur CentOS 7

    Retrouvez plus d’informations sur le site Web de Netdata et leur guide étape par étape pour plus de détails.

    Icinga 2

    Icinga est un système de surveillance qui vérifie la disponibilité des ressources de votre réseau, avertit les utilisateurs des pannes et génère des données de performance pour le reporting. Il est évolutif et extensible et peut surveiller de grands environnements complexes sur plusieurs sites.

    Caractéristiques de Icinga 2

    Reporting

    Le module de reporting Icinga est le cadre et la base créés par Icinga pour gérer les données collectées par Icinga 2 et d’autres fournisseurs de données. Il peut afficher les données directement dans l’interface Web Icinga ou les exporter au format PDF, JSON ou CSV. Avec les rapports planifiés, vous pouvez recevoir les données préparées périodiquement par e-mail.

    Graphiques et métriques

    Icinga utilise le graphite pour les graphiques et les métriques. Il s’agit d’une base de données de séries chronologiques stockant les métriques collectées et les rendant disponibles via des API restful et des interfaces Web.

    Visualisation

    Vous obtiendrez des cartes, des Processus métier, une Surveillance des certificats et un Tableau de bord Fringant.

    Surveillance des journaux

    Vous pouvez utiliser Logstash ou Graylog dans votre infrastructure.

    Scripts et interfaces de notification.

    Il existe une variété de ressources disponibles, par exemple, différents scripts de notification tels que :

    • E-mail
    • SMS
    • Pager (XMPP, etc.)
    • Twitter
    • IRC
    • Systèmes de tickets

    Guides:

    Installez et Configurez Icinga 2 et Icinga Web 2 sur CentOS 8

    Comment installer l’outil de surveillance Icinga2 sur Ubuntu 18.04 LTS

    Cacti

    À partir du site de Cactus, cet outil « est une solution graphique de réseau complète conçue pour exploiter la puissance de la fonctionnalité de stockage de données et de représentation graphique de RRDTool. Cacti fournit un poller rapide, un modèle de graphique avancé, plusieurs méthodes d’acquisition de données et des fonctionnalités de gestion des utilisateurs prêtes à l’emploi. Tout cela est enveloppé dans une interface intuitive et facile à utiliser qui a du sens pour les installations de taille LAN jusqu’aux réseaux complexes avec des milliers d’appareils.  » ”Cacti.net , 2021).

    Cacti exploite la puissance de RRDtool, un système d’enregistrement et de graphique de données OpenSource standard pour les données de séries chronologiques. Cet outil haute performance RRDtool peut être facilement et de manière transparente intégré dans des langages de script tels que les scripts shell, les applications perl, python, ruby, lua ou tcl.

    Les principales fonctionnalités de Cactus incluent les modèles

    suivants

    Les modèles de graphiques permettent de regrouper les graphiques courants par modélisation. Chaque champ d’un graphique normal peut être modélisé ou spécifié par graphique.

    Collecte de données

    Cacti a une fonctionnalité pour la saisie de données. Cela donne aux utilisateurs la liberté de développer des scripts personnalisés pour collecter des données à partir des appareils cibles. Néanmoins, il est livré avec SNMP qui est une technologie de collecte de données de l’industrie. De plus, Cacti est livré avec un poller basé sur PHP ayant les avantages d’exécuter des scripts, de récupérer des données SNMP et de mettre à jour les fichiers RRD

    Gestion des utilisateurs

    Cacti a cette fonctionnalité riche où plusieurs utilisateurs avec leurs comptes peuvent être configurés. L’administrateur a la possibilité d’allouer une partie donnée des privilèges à un utilisateur donné.

    Affichage des graphiques

    Il existe trois façons différentes d’afficher vos graphiques, à savoir, l’arborescence, la liste et l’aperçu. Ces trois vues ont leurs avantages, par exemple, la vue arborescente donne aux utilisateurs la possibilité de créer des hiérarchies de graphiques et également la possibilité de placer ces graphiques dans l’arborescence. Un grand nombre de graphiques peuvent être gérés de cette façon. La vue liste, comme son nom l’indique, est simplement une liste des graphiques disponibles et vous relie au graphique réel lorsque vous cliquez dessus. La dernière vue d’aperçu donne un visuel de tous les graphiques dans une grande liste où vous pouvez rapidement parcourir et regarder les graphiques graphiques.

    Modèles

    Il existe trois types de modèles différents: Modèles de Données, Modèles de Graphiques et Modèles d’hôtes. Cela allège le fardeau de définir toutes les sources de données et tous les graphiques sans utiliser de modèles, ce qui peut être très pénible. Le modèle de données fournit un squelette pour une source de données réelle. Les Modèles d’hôte regroupent tous les modèles de graphiques et les requêtes de données pour un type de périphérique donné. Ce qui est plus excitant, c’est que vous n’avez pas besoin de créer tous les modèles par vous-même. Les modèles peuvent être trouvés prêts à l’emploi et il existe une fonctionnalité très simple permettant d’importer de tels modèles dans votre plate-forme cacti.

    Mécanismes d’alerte

    Cacti peut être configuré pour envoyer des alertes par courrier au cas où des variables ou des seuils prédéfinis auraient été dépassés ou non atteints. Cela rend vos nuits géniales puisque vous n’avez pas à commencer à chercher des problèmes lorsque ces appels arrivent. Il indiquera qu’un certain service est en panne ou confronté à des anomalies particulières.

    Reporting

    Cacti peut générer des rapports en fonction de votre configuration.

    Grafana

    Grafana est un outil qui vous permet d’interroger, de visualiser, d’alerter et de comprendre vos métriques, peu importe où elles sont stockées. Vous avez la possibilité de créer, d’explorer et de partager des tableaux de bord avec votre équipe dans le but de favoriser une culture axée sur les données. En bref, Grafana est la solution d’analyse et de surveillance open source pour chaque base de données.

    Fonctionnalités

    Visualisez des graphiques côté client rapides et flexibles avec une multitude d’options. Plugins de panneau pour de nombreuses façons différentes de visualiser les métriques et les journaux.

    Tableaux de bord dynamiques

    Créez des tableaux de bord dynamiques & réutilisables avec des variables de modèle qui apparaissent sous forme de listes déroulantes en haut du tableau de bord.

    Explorez les métriques

    Explorez vos données grâce à des requêtes ad hoc et à une analyse dynamique. Fractionnez la vue et comparez différentes plages de temps, requêtes et sources de données côte à côte.

    Explorez les journaux

    Découvrez la magie du passage des métriques aux journaux avec des filtres d’étiquettes préservés. Recherchez rapidement tous vos journaux ou diffusez-les en direct.

    Alerte

    Définissez visuellement les règles d’alerte pour vos mesures les plus importantes. Grafana évaluera et enverra en permanence des notifications à des systèmes tels que Slack, PagerDuty, VictorOps, OpsGenie.

    Sources de données mixtes

    Mélangez différentes sources de données dans le même graphique ! Vous pouvez spécifier une source de données par requête. Cela fonctionne même pour les sources de données personnalisées.

    Annotations

    Annotez des graphiques avec des événements riches provenant de différentes sources de données. Passez le curseur de la souris sur les événements pour afficher les métadonnées et les balises complètes des événements.

    Filtres ad hoc

    Les filtres ad hoc vous permettent de créer de nouveaux filtres clé/valeur à la volée, qui sont automatiquement appliqués à toutes les requêtes qui utilisent cette source de données.

    Regards – Un œil sur votre système

    Depuis sa page githubhttps://github.com/nicolargo/ glances, Glances est un outil de surveillance multiplateforme qui vise à présenter une grande quantité d’informations de surveillance via une malédiction ou une interface Web. Les informations s’adaptent dynamiquement en fonction de la taille de l’interface utilisateur.

    Caractéristiques de Glances

    Multiplateforme

    Écrit en Python, Glances fonctionnera sur presque toutes les plateformes : GNU/Linux, FreeBSD, OS X et Windows.

    Export

    Exportez toutes les statistiques système au format CSV, InfluxDB, Cassandra, OpenTSDB, StatsD, ElasticSearch ou même RabbitMQ. Glances fournit également un tableau de bord Grafana dédié.

    Présentez un maximum d’informations dans un minimum d’espace via une malédiction ou une interface Web.

    Il peut adapter dynamiquement les informations affichées en fonction de la taille du terminal.

    Sensu

    Depuis sa page GitHub, Sensu est un outil de surveillance open source pour les infrastructures éphémères et les applications distribuées. Il s’agit d’un système de surveillance basé sur un agent avec détection automatique intégrée, ce qui le rend très bien adapté aux environnements cloud. Il utilise des vérifications de service pour surveiller l’état du service et collecter des données de télémétrie.

    • Surveillance du serveur
    • Surveillance des conteneurs
    • Inventaire en temps réel
    • Contrôles d’intégrité& métriques personnalisées
    • Alertes &Gestion des incidents
    • Correction automatisée & div>workflows personnalisés
    • Plus de 200 plugins communautaires
    • Espaces de noms et RBAC
    • Authentification de base

    Fonctionnalités du tableau de bord

    • Tableau de bord des incidents en temps réel
    • Tableau de bord des stocks en temps réel
    • Grafana Datasource
    • Tableau de bord multi-locataires (site unique)

    Fonctionnalités d’extensibilité

    • Prise en charge du langage des plugins / scripts personnalisés (par exemple C, C++, Golang, Ruby, Javascript / NodeJS, Rust, C#, Perl, Bash, etc.)
    • API de découverte, d’inventaire et de gestion des config
    • Authentification API basée sur des jetons (JWTs)

    Services &support

    • Bonsai (hosted Sensu Asset Index &CDN)
    • Support communautaire (Discourse, Slack)

    Il convient de noter qu’il existe une version entreprise de Sensu qui contient beaucoup plus de fonctionnalités. Vous pouvez en savoir plus à ce sujet dans ce lien Enterprise Sensu.

    Conclusion

    Maintenant, le choix de l’outil à utiliser vous appartient. Vérifiez-les et ayez une surveillance merveilleuse dans l’année. Avant de partir, vous pouvez passer en revue d’autres guides sucrés ci-dessous.

    Vous pouvez nous soutenir en téléchargeant cet article au format PDF à partir du lien ci-dessous. Téléchargez le guide au format PDF