Postmortem -
Read details
Jun 12, 13:52 CEST
Resolved -
Nous avons identifié qu’un routeur présente des timeouts depuis ce matin. Cet équipement vient d’être isolé afin de limiter son impact sur le service et de poursuivre les investigations dans de meilleures conditions.
L’incident est intervenu dans une période où des configurations globales étaient également en cours. À ce stade, nous ne pouvons pas confirmer qu’il existe un lien direct entre ces opérations et les timeouts observés sur le routeur. Il peut s’agir d’une coïncidence, mais ce point fait partie des éléments actuellement analysés par nos équipes.
Jun 12, 11:05 CEST
Monitoring -
Nous avons identifié qu’une erreur humaine de configuration est à l’origine de l’incident actuellement rencontré.
Cette mauvaise configuration a entraîné une perturbation du service pour une partie de nos utilisateurs. Nos équipes sont intervenues afin d’identifier précisément la cause, corriger le paramétrage concerné et s’assurer que la situation est désormais stabilisée.
Nous tenons à présenter nos excuses pour la gêne occasionnée. Nous savons l’importance de la disponibilité de nos services et regrettons sincèrement cet incident.
Une analyse interne sera menée afin de renforcer nos procédures de validation et de réduire le risque qu’une situation similaire se reproduise.
Merci pour votre compréhension.
Jun 12, 10:42 CEST
Identified -
Nous rencontrons actuellement une interruption de nos services réseau. Nos équipes techniques sont pleinement mobilisées et, suite aux investigations, nous appliquons actuellement un correctif pour rétablir la situation au plus vite.
Le retour à la normale se fera de manière progressive pour l'ensemble de nos services. Nous suivons de près l'évolution de la situation afin de garantir la stabilité de nos infrastructures.
Jun 12, 10:34 CEST