Dans les deux datacenters redondants de la Matmut, près de Rouen, les fermes de serveurs et les équipements IT forment un cloud privé qui doit délivrer des services sécurisés continus tout en préservant les données privées.
En cas d’incident de production ou de sécurité, la principale difficulté consiste à isoler les éléments permettant de mettre le doigt sur l’endroit où se trouve le problème. Nous devons gérer de nombreux logs. Ce qui prenait beaucoup de temps à nos ingénieurs, c’était d’aller retrouver dans ces journaux la petite ligne qui les intéressait face à des architectures retenant de 15 à 20 frontaux web parfois. Ils devaient passer sur chaque serveur pour éplucher les logs.
Cédric Chevrel, RSSI de la Matmut
La gestion des journaux systèmes et des incidents de sécurité de LogPoint agrège l’ensemble des journaux et conduit, par corrélations, à la source des dysfonctionnements ou chutes de performances.
L’ambition de notre projet est de donner rapidement une visibilité aux ingénieurs. La solution affiche des informations et, à la marge, lève des alertes sur seuils.
On est encore loin de l’auto-réparation de l’infrastructure, selon le RSSI, car l’analyse humaine demeure importante, face aux cas d’usage métiers. Il apprécie en revanche, les modules d’intégration et le support de l’éditeur qui assurent la cohérence des examens de journaux, quelle que soit la provenance des équipements.
La plateforme d’agrégation permet des requêtes portant sur plusieurs équipements ce qui met en évidence les facteurs discriminants, ou bien des signaux faibles et les causes racines des problématiques qu’on observe.
L’équipe informatique de la Matmut compte 300 experts, prestataires inclus, qui sont répartis entre le pôle éditeur (projets et études) et le pôle hébergeur (infrastructures et hébergement d’applications).